欢迎光临广州生物与健康产业高性能计算应用平台! 常用工具 | 下载中心 | 登录 | 注册 | 关于我们 | 联系我们

网络文献挖掘

  高通量筛选方法(基因芯片、蛋白质组学等)已成为常规的实验方法,常用于筛选差异表达基因,进一步地利用一些软件或者数据库解析这些差异表达基因的功能,参与的生物学过程、调控通路,和蛋白质相互作用网络等,从而探索疾病的发病机理和分子机制。目前人工注释数据库注释的基因功能和分子相互作用存在数量不够多、范围不够广的两大问题,而文献挖掘的方法直接从文献中获取信息,是解析基因的有效的辅助方法。




网络文献挖掘系统GenCLiP 2.0>>>




CooLGeN>>>


  通过PubMed摘要的文献信息注释基因功能、构建分子网络和检索相关基因的主要方法:1)计算机根据词频自动挖掘基因的关键词,并通过人工添加的方式注释客户关注的关键词,通过统计学检验筛选出分析基因富集的关键词,再用模糊聚类的方法将关键词按相关程度分组;2)从文献中准确识别分子相互作用,整合公共的互作数据(包括HPRD、BioGRID、CORUM和IntAct),构建分子互作网络;3)挖掘与任意检索词共同出现在一个句子或摘要的基因,人工查阅文献确定与检索词相关的基因。详细信息参阅已发表论文(PMID:24764463)。



应用领域

差异表达基因分析
分子相互作用网络研究
疾病研究
相关基因检索



技术路线

分析内容

  1、分析一组基因(<3000个,可事先区分上调和下调基因):筛选有统计学意义的关键词,给出注释结果列表,关键词与基因的聚类分析热图(图1);构建互作网络图,标注与感兴趣主题相关的基因(图2)。可根据老师关注的研究内容挖掘关键注释和互作网络中的核心基因。

  2、对指定的研究主题(提供详细的英文词汇),给出已报道与之相关的基因,可从全部人基因或给定的一组基因中筛选,为相关基因提供关键的文献证据及来源,并构建基因网络。如找出已报道与上皮间充质转换(EMT)相关的人基因,构建EMT基因网络图(图3)


图1. 关键词与基因聚类分析热图


图2. 分子互作网络图。红色为上调表达基因,绿色为下调表达基因,紫色边框的为与某个研究相关的基因


图3. EMT基因网络图。绿色为已知基因,黑色为重新检索确认的基因。

支持与帮助

请致电020-87568623-615或发邮件:zjg@gzbio.org

CopyRight &copy 2015 广州生物工程中心   All Rights Reserved.

粤ICP备12345678号-3

0.0176s