岗位职责: 1. NGS数据处理与分析 负责高通量测序(NGS)数据的预处理、质量控制、序列比对、变异检测及注释工作。 使用现有的工具和管道(如FASTQC、BWA、GATK等)对NGS数据进行清洗和规范化处理。 参与多组学数据的整合分析,如转录组、基因组和表观遗传数据。 2. 靶标筛选 参与疾病相关的靶标基因或生物标志物的筛选与验证工作。 结合公开数据库(如GEO、TCGA、Ensembl)和内部数据进行候选基因或生物标志物的筛选和分析。 支持团队开发新的计算方法和工具,优化靶标筛选流程。 3.建模与预测 协助开发和应用机器学习模型,用于预测潜在靶标及其生物功能。 根据需求构建分类模型、回归模型或聚类模型,利用如Python、R、scikit-learn等工具进行模型训练和评估。 协助使用生物统计学和数据科学的方法,优化模型性能,进行交叉验证和结果可视化。 4.数据可视化与报告 使用R、Python等工具生成专业的分析报告和数据可视化图表(如heatmap、volcano plot、ROC曲线等)。 能够清晰地解释复杂数据分析结果,并向跨学科团队成员(如生物学家、医生等)进行汇报。 5. 团队协作与支持 与其他团队成员(生物信息学家、数据科学家、生物学家等)协作,提供数据分析的支持。 根据项目需求,持续跟踪最新的NGS分析工具和方法。 任职要求: 1.教育背景 生物信息学、计算生物学、统计学、数据科学或相关领域的学士或硕士学位。 2.技术技能 具备NGS数据分析基础知识,有RNA-seq、ChIP-seq、WGS等数据处理经验者优先。 熟练掌握Python或R编程语言,具备数据处理、统计分析和建模能力。 熟悉Linux/Unix环境中的命令行操作。 3.软件与工具 熟悉常用的生物信息学工具和数据库(如FASTQC、STAR、BWA、GATK、GEO、TCGA等)。 具备数据可视化的能力,熟练使用ggplot2、matplotlib等工具。 4. 分析与问题解决能力 有较强的数据分析、问题解决及结果解读能力。 对生物数据、基因组学数据感兴趣,能够独立完成分析任务。 5. 沟通与协作 具备良好的团队合作精神,能与不同背景的团队成员有效沟通。 良好的中英文书面和口头表达能力。 优先考虑: 具有NGS数据分析或生物标志物筛选相关实习或项目经验者优先。 有分子诊断IVD产品开发经验者优先。 具备专利复现和知识产权相关工作经验者优先。 有机器学习或深度学习模型开发经验者优先。