[新闻] “数据要素×”典型案例之十三 | 高质量药物数据集提高新药研发质效| 数博会官网

“数据要素×”典型案例之十三 | 高质量药物数据集提高新药研发质效

作者: 国家数据局    来源: 国家数据局   编辑: 和璟祎  时间:2024-06-17 11:11:01  

  "5月24日,国家数据局会同生态环境部、交通运输部、金融监管总局、中国科学院、中国气象局、国家文物局、国家中医药局等相关部门在第七届数字中国建设峰会上发布第一批20个“数据要素×”典型案例,通过示范引领,激励多方主体积极参与,释放数据要素价值。"

  提升创新药自主研发能力关乎国家生物医药产业转型升级,也与国家生物安全自主可控、国民生命健康紧密相连。高质量药物数据在新药研发的过程中至关重要,目前国内药物数据来自不同细分领域的学术数据库,存在流通不畅、资源分散和标准不统一等问题。北京市计算中心有限公司通过多渠道、合规收集海量药物研发关键数据,建立专业的新药研发数据集,进行智能化分析和数据挖掘,有效降低新药研发周期,赋能上百个新药研发项目。

  一是多渠道收集药物研发数据。通过公开数据库下载、文献信息整理、公开渠道购买等多种方式,收集药物相关的分子结构、理化性质和靶点信息等药物研发关键数据,并通过计算机辅助和人工校验确保数据质量可靠,为科研人员提供了较强的数据支持,明显提高药物研发的准确性、可靠性和实用性。

  二是建立高质量新药研发数据集。对汇聚数据进行统一处理,形成能够支撑药物数据研发的高质量数据集,该数据集包括小分子、多肽和蛋白靶点数据,其中小分子和多肽信息400余万条(几乎覆盖当前全部药物数据领域),潜在的药物活性位点超过11万个。

  三是智能化分析和挖掘数据。基于人工智能算法对药物数据集进行数据挖掘和药物特征提取,形成疾病相关的药物有效特征,为新疾病靶点预测和对应药物研发提供准确、个性化、智能化分析服务。目前已与全国30余家高校和科研院所开展合作,利用高质量药物数据集和智能服务开展的新药研发项目100余项,人工智能预测靶点超1万余个,基本覆盖了已知疾病。

  微信图片_20240617111222.png

  图与北京某高校合作,针对已知药物的靶标确认展开研究