protein data-efficient蛋白质pretraining

贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据|附代码数据

原文链接:http://tecdat.cn/?p=22702 最近我们被客户要求撰写关于贝叶斯分位数回归的研究报告,包括一些图形和统计输出。 贝叶斯回归分位数在最近的文献中受到广泛关注,本文实现了贝叶斯系数估计和回归分位数(RQ)中的变量选择,带有lasso和自适应lasso惩罚的贝叶斯 摘要 还包 ......
位数 数据 球蛋白 前列腺癌 腺癌

易基因:动脉粥样硬化中的DNA甲基化和组蛋白修饰及其表观遗传治疗视角|综述

动脉粥样硬化(Atherosclerosis, as)是一种以动脉血管壁炎症和斑块积聚为特征的血管病变,是大多数心血管疾病的重要病因。除了脂质沉积和慢性炎症外,越来越多的证据表明表观遗传修饰与动脉粥样硬化越来越相关,并从治疗和生物标志物的角度都很有意义。本文就DNA甲基化和组蛋白翻译后修饰在动脉粥样 ......
表观 甲基 动脉 视角 基因

【论文阅读笔记】【多模态-Vision-Language Pretraining】 BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation

BLIP ICML 2022 (Spotlight) 读论文思考的问题 论文试图解决什么问题?写作背景是什么? 问题: 在视觉-语言预训练(VLP)中,如何更加高效地利用充斥着噪声的海量图文对数据,提升预训练效果? 如何设计模型,使得预训练后的模型在理解(understanding-based)任务 ......

蛋白质定量技术 | Mass Spectrometry | LC-MS/MS | CyTOF | RIME | 单细胞蛋白组测序

名词解释: LC-MS - Liquid chromatography–mass spectrometry 液相色谱-质谱联用仪 CyTOF - Cytometry by time of flight - 质谱流式细胞技术 RIME - Rapid Immunoprecipitation Mass ......

蛋白质组搜库软件MaxQuant使用教程

目录MaxQuant基本原理MaxQuant使用MaxQuant实操 MaxQuant基本原理 MaxQuant使用 MaxQuant实操 更多信息请关注: ......
蛋白质 蛋白 MaxQuant 教程 软件

A novel essential protein identification method based on PPI networks and gene expression data

A novel essential protein identification method based on PPI networks and gene expression data Jiancheng Zhong 1 2, Chao Tang 1, Wei Peng 3, Minzhu Xi ......

LPI-IBWA: Predicting lncRNA-protein interactions based on an improved Bi-Random walk algorithm

LPI-IBWA: Predicting lncRNA-protein interactions based on an improved Bi-Random walk algorithm Minzhu Xie 1, Ruijie Xie 2, Hao Wang 3 Affiliations exp ......

B4185. LPI-IBWA:Predicting lncRNA-protein Interactions Based on Improved Bi-Random Walk Algorithm

B4185. LPI-IBWA:Predicting lncRNA-protein Interactions Based on Improved Bi-Random Walk Algorithm Minzhu Xie1, Hao Wang1 and Ruijie Xi1 1Hunan Normal ......

易基因:人早期胚胎发育的表观遗传调控(染色质重塑+组蛋白修饰+DNA甲基化)|深度综述

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 哺乳动物发育研究促进了对协调胚胎发生遗传、表观遗传和细胞过程的理解,并揭示了对人类胚胎发生特异性新见解。最近研究生成了人类早期胚胎发生的第一个表观遗传学图谱,激发了关于表观遗传学重编程、细胞命运调控以及支撑人类胚胎发育可塑性的潜在机制新 ......
表观 胚胎 甲基 基因 蛋白

DNA | RNA | Protein | 提取 | 纯化 | 定量

这算是wet lab实验室最为基本的技能了。 基因克隆,从Ecoli里提取质粒,不要忘了加RNase,否则在做gateway cloning的时候RNA会抑制LR反应。 不同用途的实验对DNA、RNA、Protein的纯度要求是不一样的,这你要自己去摸索,比如普通Lentivirus packagi ......
Protein DNA RNA

PreTrainedModel 中 from_pretrained 和 load_state_dict 的关联

from_pretrained AutoTokenizer.from_pretrained:从path/vocab.json中加载tokenizer AutoConfig.from_pretrained:从path/config.json中加载模型配置信息 更新模型配置信息:model = Mode ......

[论文精读][基于点云的蛋白-配体亲和力]A Point Cloud-Based Deep Learning Strategy for Protein-Ligand Binding Affinity Prediction

我需要的信息 代码,论文 不考虑共价键,每个点包括了六种原子信息,包括xyz坐标,范德华半径,原子重量以及来源(1是蛋白质,-1是配体)。原子坐标被标准化,其它参数也被标准化。对不足1024个原子的的复合体,补0到1024。 增加考虑的原子从1024到2048,没有提升,增加原子信息通道,没有提升( ......

免疫共沉淀实验 | co-IP | 蛋白相互作用

Co-IP全称Co-Immunoprecipitation,中文学名免疫共沉淀,是一种以抗体和抗原识别专一性为基础,用于研究蛋白质之间相互作用的经典方法。 通俗点来说,假设我们需要研究样品中A蛋白和B蛋白之间是否存在一些相互作用,首先我们通过合适的方法处理样本,将蛋白提取出来(同时不能破坏蛋白之间的 ......
相互作用 蛋白 作用 co-IP co

易基因:ChIP-seq揭示组蛋白修饰H3K27me3调控高温下棉花的雄性不育机制|Plant Com

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 气候变化导致极端天气事件更加频繁地发生,包括反常的高温(high temperature,HT),HT胁迫对作物的生长发育和产量有严重的负面影响,如平均生长温度每升高1°C,水稻产量就会下降10%,这一下降主要是由于对生殖发育的影响。棉 ......
雄性 棉花 基因 蛋白 高温

UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.解决办法

87iuiu由于ii from torchvision import models # 旧版本的写法,将在未来的torchvision 0.15版本中被Deprecated model_old = models.resnet50(pretrained=True) # deprecated model ......

ConSurf-StandAlone | 蛋白保守性得分

ConSurf-StandAlone https://github.com/leezx/ConSurf-StandAlone /home/zz950/tmpData/consurf 如果对特定的fragment感兴趣,可以去做MSA,https://www.uniprot.org/uniprotkb ......

易基因: MeRIP-seq等揭示组蛋白乙酰化和m6A修饰在眼部黑色素瘤发生中的互作调控|肿瘤研究

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 组蛋白去乙酰化抑制剂(HDACis)在多种恶性肿瘤中显示出令人鼓舞的结果。N6-甲基腺嘌呤(m6A)是最普遍的mRNA修饰,在肿瘤发生调控中起重要作用。然而,对组蛋白乙酰化和m6A RNA修饰之间的互作研究仍然未知。 2023年7月19 ......
黑色素瘤 乙酰 眼部 肿瘤 基因

拟南芥Sec14蛋白(SFH5和SFH7)介导磷脂酸在细胞器间的转运,并调控叶绿体的发育

脂质在真核光合生物的叶绿体中建立了特殊的类囊体膜,然而,从其他细胞器向叶绿体传递脂质的分子机制仍需要进一步阐明。在这里,我们揭示了拟南芥Sec14同源蛋白AtSFH5和AtSFH7在从内质网(ER)传递磷脂酸(PA)到叶绿体中的结构基础,以及它们在调控叶绿体脂质组成和类囊体发育中的功能。AtSFH5 ......
拟南芥 细胞器 叶绿体 磷脂 蛋白

Nature 重磅!赖氨酸代谢介导组蛋白巴豆酰化重塑肿瘤免疫

胶质母细胞瘤(GBM)呈现出免疫抑制性的肿瘤微环境(抑制T细胞浸润、激活及作用),也限制了免疫疗法的疗效。在GBM中,胶质母细胞瘤干细胞(GCS)的自我更新会促进细胞分化并产生耐药性。氨基酸代谢会影响T细胞的活化和功能,限制氨基酸摄入可以有效抑制体内的肿瘤生长。赖氨酸代谢会产生多种生物活性物质,如巴 ......
巴豆 赖氨酸 重磅 肿瘤 蛋白

[论文精读][计算生物][蛋白质预训练表示]Data-Efficient Protein 3D Geometric Pretraining via Refinement of Diffused Protein Structure Decoy

笔者正在调研市面上的蛋白表示方法,论文方法过于数理的部分会被抽象带过。 ## Basic Information: * Title: Data-Efficient Protein 3D Geometric Pretraining via Refinement of Diffused Protein St ......

Latent generative landscapes as maps of functional diversity in protein sequence space

## 0. foreword 最近看了一篇比较有意思的文章,而且要讲组会了,认真学习一下顺便做个随笔当做我讲组会的草稿 (文章并不是直接翻译,文章的内容按照自己的理解进行了些改动) ## 1. Abstract 变分自编码器是一种无监督的生成模型,当把它应用在蛋白质数据上的时候,可以利用它按照系统发 ......

最长蛋白序列和最长转录本提取

#### 1. 第一种数据格式为protein.fa(translated.fa) 和 gene.gtf文件,序列信息如下 ![](https://img2023.cnblogs.com/blog/1775879/202307/1775879-20230731150638409-1442956648 ......
序列 蛋白

HuggingFace | HuggingFace中from_pretrained函数的加载

我们使用huggingface的`from_pretrained()`函数加载模型和`tokenizer`,那么加载这些需要什么文件? ![](https://img2023.cnblogs.com/blog/3085423/202307/3085423-20230729184714304-1663 ......

dTAG蛋白降解系统

非常火的一个由DFCI开发的药物系统,原理就是蛋白降解,在实验室里就在目标蛋白后面加一个尾巴,它会连接到泛素化降解系统,从而降解目标蛋白。 dragging a protein of interest (POI) to a E3 ligase for degradation like dTAGv1, ......
蛋白 系统 dTAG

Proj. CAR Paper Reading: CodeBPE: Investigating Subtokenization Options for Large Language Model Pretraining on Source Code

## Abstract 本文:探索LLM在source code上pretrain时的subtokenization效果。 subtokenization: split long tokens into smaller subtokens, in order to ensure the relati ......

pretrain

# BACKBONE ## 前言 本篇博客记录常见backbone,具体如下: 1. ResNet 2. HRNet 2. Mobilenetv1 2. Mobilenetv2 2. Mobilenetv3 ## ResNet ## HRNet HRNet打通了多个视觉任务, 姿态估计参考[HRNe ......
pretrain

易基因:NAR:ChIP-seq等揭示蛋白质酰基化与c-di-GMP协同调控放线菌发育与抗生素合成机制|项目文章

易基因细菌ChIP-seq测序分析结果见刊《Nucleic Acids Research》 大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 2023年06月07日,华东理工大学生物工程学院和生物反应器工程国家重点实验室叶邦策教授和尤迪副教授为共同通讯作者、博士生符瑜为第一作者以“A ......
放线菌 酰基 抗生素 蛋白质 基因

比较新冠病毒与蝙蝠和穿山甲冠状病毒基因组/蛋白序列比对,更好地了解COVID-19病原体SARS-CoV-2的起源与进化

比较新冠病毒与蝙蝠和穿山甲冠状病毒基因组/蛋白序列比对,更好地了解COVID-19病原体SARS-CoV-2的起源与进化 作者:王怡然 石育 赵月馨 沈讯 摘要:在新冠病毒COVID-19大流行的时代背景下,病毒的遗传信息对于其分类和可追溯性及其致病性至关重要。在全基因组水平上,SARS-CoV-2 ......
病毒 穿山甲 病原体 基因组 病原

基于多源生物信息发现新蛋白并对E18分析

摘要:挖掘必要的蛋白质对于发现细胞的组织和生存过程至关重要。目前,检测必需蛋白质的计算方法很多。然而,这些现有的方法只关注网络的拓扑信息,而忽略了蛋白质的生物信息,导致对必需蛋白质的识别准确率较低。因此,本文提出了一种新的关键蛋白质预测策略,称为DEP-MSB,它综合了多种生物信息,包括基因表达谱、 ......
蛋白 生物 信息 E18 18

蛋白质概念

蛋白质是由氨基酸组成的。氨基酸是一类有机分子,它们包含一个氨基基团(NH2)、一个羧基基团(COOH)、一个氢原子以及一个侧链(R基团)。在蛋白质中,多个氨基酸通过肽键连接在一起形成多肽链,进而折叠成特定的三维结构。 有20种常见的氨基酸参与蛋白质的合成。这些氨基酸在结构上有所不同,主要是由于它们的 ......
蛋白质 蛋白 概念