很多人覺(jué)得數(shù)據(jù)分析入門很難,但隨著B站和公眾號(hào)上的學(xué)習(xí)資源越來(lái)越多,學(xué)習(xí)數(shù)據(jù)分析已經(jīng)變得非常簡(jiǎn)單。以下面為例,從一張規(guī)則的表格中,根據(jù)門水平名稱,生成對(duì)物種門水平的表格文件。
In [1]:
import pandas as pd
讀取文本文件pd.read_table,讀取excel文件,
可以用df = pd.read_excel('*.xlsx',sheet_name='*')。
In [2]:
df = pd.read_table('subsample_otu.tax.0.03.xls')
如下圖所示,門水平有12個(gè)門的數(shù)據(jù)。
In [3]:
df['phylum'].unique()Out[3]:
array(['Acidobacteria', 'Actinobacteria', 'Armatimonadetes', 'Bacteroidetes', 'Chloroflexi', 'Firmicutes', 'Fusobacteria', 'Gemmatimonadetes', 'Planctomycetes', 'Proteobacteria', 'Spirochaetes', 'Synergistetes'], dtype=object)
In [4]:
for i in df['phylum'].unique(): df[df['phylum']==i].to_excel(i+".xls",index=False)Out[4]:
往期相關(guān)鏈接:
1、R基礎(chǔ)篇
excel不熟練怎么辦,R來(lái)幫您(一)數(shù)據(jù)分類匯總; R相關(guān)軟件及R包安裝;【零基礎(chǔ)學(xué)繪圖】之氣泡圖繪制(六);
2、R進(jìn)階
【繪圖進(jìn)階】之通路與菌的相關(guān)性分析熱圖(六);
【繪圖進(jìn)階】之六種帶中心點(diǎn)的PCA 圖和三維PCA圖繪制(四);
【繪圖進(jìn)階】之交互式可刪減分組和顯示樣品名的PCA 圖(三);
【進(jìn)階篇繪圖】之帶P值的箱體圖、小提琴圖繪制(一);
3、數(shù)據(jù)提交
3分鐘學(xué)會(huì)微生物多樣性云平臺(tái)數(shù)據(jù)分析;
3分鐘學(xué)會(huì)CHIP-seq類實(shí)驗(yàn)測(cè)序數(shù)據(jù)可視化 —IGV的使用手冊(cè);
10分鐘搞定多樣性數(shù)據(jù)提交,最快半天內(nèi)獲取登錄號(hào),史上最全的多樣性原始數(shù)據(jù)提交教程;
20分鐘搞定GEO上傳,史上最簡(jiǎn)單、最詳細(xì)的GEO數(shù)據(jù)上傳攻略;
4、表達(dá)譜分析
表達(dá)譜分析(二)通路富集分析和基因互作網(wǎng)絡(luò)圖繪制;如何對(duì)GEO數(shù)據(jù)進(jìn)行差異分析;
miRNA靶基因預(yù)測(cè)軟件__miRWalk 3.0;
5、醫(yī)學(xué)數(shù)據(jù)分析
KING: 樣本親緣關(guān)系鑒定工具;【W(wǎng)GS服務(wù)升級(jí)】人工智能軟件SpliceAI助力解讀罕見(jiàn)和未確診疾病中的非編碼突變;
隱性疾病trio家系別忽視單親二倍體現(xiàn)象——天昊數(shù)據(jù)分析助力臨床疾病診斷新添UPD(單親二倍體)可視化分析工具;
【昊工具】Oh My God! 太好用了吧!疾病或表型的關(guān)鍵基因查詢數(shù)據(jù)庫(kù),我不允許你不知道Phenolyzer;
天昊客戶服務(wù)中心
手機(jī)/微信號(hào):18964693703
【本群將為大家提供】
分享生信分析方案
提供數(shù)據(jù)素材及分析軟件支持
定期開展生信分析線上講座
QQ號(hào):1040471849
作者:大熊
審核:有才
來(lái)源:天昊生信團(tuán)