新冠病毒分析可视化数据共享平台

项目演示视频,已经保存到百度网盘链接: https://pan.baidu.com/s/1GZ4FS4ntan5uXTPsSMdc4w?pwd=pehb 提取码: pehb

项目介绍

数据来源:自新冠病毒爆发以来,各国科研人员在病毒测序方面做了大量的工作。全球流感数据倡议组织(GISAID https://www.gisaid.org/)对各国科研人员提交的病毒序列进行整理和展示,并提供下载。本文使用的病毒数据来自GISAID,截止到2020年9月22日共计104797条来自115个国家的病毒序列样本。
方法:基于NextStrain平台构建新冠病毒的进化树,并获取所属的病毒分支。采用生物信息学中的Kmer-5方法提取病毒序列特征,并采用KNN,随机森林等机器学习方法模型训练样本数据。可在几秒内实现对新冠病毒序列分类的计算,并且识别的准确率为99%。

  • 基于NextStrain平台构建的进化树

image.png

项目实现的功能

  • 基于机器学习的新冠病毒序列分类:实现对新冠病毒的分支识别。用户只需在网页前端上传基因序列文件,即可在短时间获得输入文件的病毒类别,识别准确率可达99%。

image.png

  • 2、数据可视化:通过数据可视化对数据进行展示:a.某病毒分支在全球的扩散范围,可了解每个国家的病毒类占比。b.单核苷酸多态性(SNP)突变与国家、性别和年龄的相关可视化。让我们对病毒有更加深入地了解。

image.png

  • 3、数据共享:通过数据过滤和特征提取方法对数据集进行整理,在网页前端展示数据集。支持通过提供的API接口获取所有处理后的数据集,提供数据共享。

新冠病毒分析可视化数据共享平台
http://example.com/2020/08/31/新冠病毒分析可视化数据共享平台/
作者
Adam-LXD
发布于
2020年8月31日
许可协议