首頁(yè) 猿問(wèn) 用數(shù)據(jù)庫(kù)處理大量純文本

用數(shù)據(jù)庫(kù)處理大量純文本

JavaScript

BIG陽(yáng) 2019-04-19 15:59:11

我本職是研究結(jié)構(gòu)生物學(xué)的,經(jīng)常需要寫(xiě)腳本程序來(lái)處理大量純文本,對(duì)于同一個(gè)蛋白質(zhì),有很多種格式的數(shù)據(jù),比如:pdb格式ATOM1NMET144.017-3.1949.239ATOM2CAMET143.506-1.8299.263ATOM3CMET142.074-1.8399.749ATOM4OMET141.422-2.8489.638ATOM5CBMET143.723-1.2157.865fasta格式>./3odiA165MVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHRIIPGFMCQGGDFTRHNGTGGKSIYGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICTAKTEWLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKITIADCGQLE我通常通過(guò)后綴名來(lái)分辨,比如3odiA.pdb和3odiA.fasta.但bash或者python腳本寫(xiě)起來(lái)需要考慮文件路徑,十分繁瑣.我想數(shù)據(jù)庫(kù)應(yīng)該可以很好地解決我的問(wèn)題,比如用3odiA作key,文本中的strings作value,但是要具體實(shí)現(xiàn)起來(lái)確實(shí)沒(méi)什么經(jīng)驗(yàn)(非cs出身).各位可否給一些建議?比如,用什么數(shù)據(jù)庫(kù)?有什么類似的解決方案可供參考的?

查看完整描述

2 回答

HUH函數(shù)

TA貢獻(xiàn)1836條經(jīng)驗(yàn) 獲得超4個(gè)贊

據(jù)我所知，生物學(xué)都是perl黨，perl雖然有點(diǎn)晦澀，但確實(shí)是玩純文本最溜的語(yǔ)言不如說(shuō)至今通行的正則還叫pcre=兼容perl的正則表達(dá)式

反對(duì) 回復(fù) 2019-04-19

2 回答
0 關(guān)注
223 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書(shū)簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

用數(shù)據(jù)庫(kù)處理大量純文本

用數(shù)據(jù)庫(kù)處理大量純文本

2 回答

添加回答