生命数字化时代来临:全基因组计算成本不到1美元
基因组序列分析是生命科学和医疗保健行业领域的重要组成部分,是众多技术突破的关键。随着生命数字化时代的来临,为了解决大数据带来的速度与费用问题,在云计算平台进行流程的分析及计算是目前较流行的方案。然而大部分用户通常直接采用了未优化的软硬件配置,导致样本分析成本过高。因此,如何在云平台上选择合适的硬件配置,从而平衡计算成本与分析速度,成为了值得探索的问题。
Sentieon Arm版本:进一步降低基因组计算成本
前不久,Arm在其社区的HPC blog上发布了一篇Sentieon在低通量全基因组(LP-WGS)的应用案例。
用IT加速 BT,腾讯云发布生物基因解决方案
本文介绍了腾讯云与百迈客生物科技达成战略合作,并发布了生物基因解决方案,包括提供云计算、存储、人工智能等IT能力,帮助生物基因行业发展,同时通过腾讯云双螺旋PaaS平台,快速基于云计算开展科研工作,推动精准医疗落地,普惠社会。
chip_seq质量评估之计算样本间的相关性
在chip_seq的实验中,由于抗体反应的敏感性,生物学重复样本的一致性很难把控。为了保证重复样本具有较好的一致性,除了在实验上保证操作流程的规范化,对于测序数据,我们也需要对其进行评估。
提升UMI分析精度和计算效率:Sentieon UMI分子标记处理模块
单分子标签技术(Unique Molecular Identifier, UMI)被广泛应用在极高灵敏度的NGS检测中,尤其是目前炙手可热的循环肿瘤DNA (ctDNA) 检测。ctDNA作为一种非侵入性的肿瘤生物标志物,以其极高的灵敏度,可用于癌症早筛早检,治疗反应的实时监控等。因此,大量的研究工作围绕ctDNA而展开。然而,由于传统NGS检测灵敏度受限于PCR和测序的错误率(~1%),必须通过UMI来保证ctDNA检测的高灵敏度和特异性。
CellPress | 为计算蛋白设计革命做好准备
由于对蛋白质功能的预测性控制和重新定义这些功能的能力已经推动蛋白质工程领域进入了一个前所未有的发展时代,因此,计算蛋白质设计被预测将为生物技术产业提供下一个量子飞跃。自然界只采样了约1012种不同的可能的蛋白质,而一个100个氨基酸的蛋白质有20100种潜在的序列变化。通过将计算设计融入到生产治疗性蛋白质的工作流程中,研发部门可以利用计算能力的快速发展,在创纪录的时间内设计出精确的功能性新型蛋白质治疗剂。
Day-3 香波🐟
在minicondon 清华镜像网站中下载最新的miniconda版本https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-py39_23.10.0-1-Linux-x86_64.sh
人生第一次下载Reactome 基因集
单细胞转录组分析不能局限在基因的差异表达,需要具体到某个生物学功能上来,才能近一步揭示生物学意义。通常进行差异基因的功能富集分析,包括GO、KEGG、REACTOME等数据库。
1️⃣ 序列获取(2):RNA序列获取
虽不编码蛋白质,但是参与包括染色质结构重建,基因表达层面的转录和翻译调控,亚细胞位置等调控。主要来自于
chipBase:转录因子调控网络数据
chipBase收集来自GEO,ENCODE数据库中的chip_seq数据,通过对这些原始数据进行分析,致力于构建各种转录因子与非编码RNA, 蛋白编码基因之间的调控网络,网址如下
HiGlass:高度定制的Hi-C数据可视化应用
HiGlass是一个hi-C数据可视化的web应用,参考UCSC基因组浏览器和juicebox中数据的展示形式,运用D3.js等流行的可视化框架对数据进行展示,基于web技术提升了用户的交互体验,缺点就是需要搭建过程比较繁琐。网址如下
生信马拉松 Day14 conda!
anaconda:所有语言的包、依赖和环境管理器,几乎全平台(Windows、macOS、Linux)
ChIP-Atlas:基于公共chip_seq数据进行分析挖掘
ChIP-Atlas收集整理了SRA数据库中的大量chip_seq数据,并基于这些原始数据进行了后续分析,将分析结果整理成在线服务并发布,方便检索与查询,网址如下
Day7-蓝色柠檬
今天学习的内容是前段时间小组讨论中导师给科普的一部分知识-一二三代测序,那时候觉得晦涩难懂,今天这个课程安排的非常巧妙,了解测序原理需要一定的想象力,同时对基础技术知识有一定的积累,今天在【生信星球】第七课的推动下进行了思维导图的书写希望自己能够对测序加深了解,逐步了解测序相关内容。
一种下载GEO原始数据CEL文件的方法(网络畅通版)
1、在已知GSM样本号之后,笔者以“GSM21231”为例。使用GEOquery包中的getGEOSuppFile函数获得cel文件的URL。
QB期刊 | 深度学习在生物学中的应用1:对MinION测序结果中base calling的计算
记得去年“阿尔法狗”(AlphaGo)的新闻出来后,小编曾下定决心要跨专业学习一下AI,看看它能否在咱们生物领域也掀起热浪。结果当小编刚刚了解到阿尔法狗的命脉乃来自Deep Learning (深度学习)真传时,它的亲兄弟“AlphaFold” 就以迅雷不及掩耳之势(2018年12月初召开新闻发布会,具体见阿尔法狗再下一城 | 蛋白结构预测AlphaFold大胜传统人类模型)在蛋白质折叠预测领域独领风骚。有生物学背景的我们都知道,虽然科学家们破译了基因组,但从DNA到蛋白质翻译过程受各种基因和/或蛋白质的调控、修饰,并且蛋白质从翻译产生到能发挥功能的这一过程也是在细胞内经历了各种修饰、折叠。但人家“AlphaFold”则不畏这些千难万苦,“硬生生”的通过氨基酸序列直接预测蛋白质的3D结构(AlphaFold 的新闻发布链接:https://deepmind.com/blog/alphafold/)。所以当“AlphaFold”一出世,大家都惊呼它是能把诺贝尔奖抱回家的人选之一。
Ubuntu Cinnamon的第一个发行版终于发布了!
简介:Ubuntu Cinnamon是一个新发行版,它在Ubuntu代码库的基础上利用Linux Mint的Cinnamon桌面环境。它的第一个稳定版本基于Ubuntu 19.10 Eoan Ermine。
下游分析内容可视化——R语言day4依芙
1.依次安装R语言、Rstudio、Rtools,Rstudio相当与VS code,直接bing搜索R,不选镜像,选择原网站的download R,跳转到https://cloud.r-project.org/,点击`Download R for Windows`
突变对蛋白功能影响预测
在每个分析开始之前,我们都需要命名一个数据的ID。这个ID可以让我们以后,如果想要继续查看结果的话,直接在Job Queue里面输入ID即可。
原核生物基因预测
在得到了一个物种的基因组序列之后,就可以开始对其序列进行分析了。序列分析主要包括结构基因组分析,功能基因组分析以及比较基因组分析几部分。通过对序列进行全面地分析,在基因组水平上了解一个物种的特点。序列分析主要包括基因预测,基因功能注释,ncRNA,重复序列,特殊功能序列,比较基因组等方面。