首頁 > 公眾號 > 正文

《生態學與演化》:當化石形態學遇上信息論
2021-09-07 10:00:51   來源:化石網   評論:0 點擊:

經典通信系統模型與基于信息論框架的古生物學 New Research(化石網整理)據中科院古脊椎所(作者:余琮煜、江左其杲、王海冰):長久以來,化石作為古生物學研究最主要也是幾乎唯一的材料不可避免地受到保存環


經典通信系統模型與基于信息論框架的古生物學 New Research

(化石網整理)據中科院古脊椎所(作者:余琮煜、江左其杲、王海冰):長久以來,化石作為古生物學研究最主要也是幾乎唯一的材料不可避免地受到保存環境的影響,其中的噪聲造成了形態學特征的不完整與失真,進而影響后續的系統發育和功能形態方面研究。盡管部分研究討論了不同地區與年代中化石保存的完整性,但其中絕大多數停留在數據收集與統計上,并沒有將化石中受到噪聲的影響量化。甚至在大量古生物學研究中,信息一詞也常常與數據,信號,觀測結果等等概念混淆,并沒有清晰的定義。這些基礎概念的模糊導致了在系統發育研究中,不同作者對于“特征”、“物種”等概念缺乏共識,學界始終缺乏合適的理論框架與方法對化石中的形態學信息進行定量化的研究。
 
近日,國際學術期刊《生態學與演化》(Ecology and Evolution)在線發表了由美國自然歷史博物館余琮煜,北京大學地球與空間科學學院江左其杲,中科院古脊椎所王海冰等合作的題為“形態學特征中的信息(Information in morphological characters)”的論文,提出了可以將信息論與通信系統工程作為古生物形態學研究的理論基礎。文章討論了多個脊椎動物形態學特征矩陣中的信息熵,互信息,信道容量等參數,提出目前的形態學矩陣并沒有很好地區分信源編碼與信道編碼,不同特征之間差異較大的信息熵往往被忽視,矩陣中過多的特征數量可能導致了信息傳遞的低效。
 
盡管人造通信系統存在的時間幾乎與人類的歷史一樣久遠,但對通信系統完整的數學描述直到1948年才被克勞德·香農提出。一個典型的通信系統可以分為信源,發送設備,信道,接收設備,信宿,其中信道在現實中往往伴隨著噪聲。信源中的原始消息(message)經過發送設備編碼之后進入信道,接收設備收到編碼信號(signal)之后進行解碼將消息傳遞給信宿,由于現實通信中幾乎無法避免噪聲,為了確保解碼后的消息與編碼前的消息的一致性,精心設計的編碼是非常必要的。香農提出編碼過程可以進一步細分為信源編碼與信道編碼,而且這兩個步驟可以分開進行互不影響。信源編碼需要以盡可能低的成本(編碼長度)表示出所有可能出現的消息,也就是要完整表達出信源的信息熵,其典型例子有電報通信中的摩斯電碼。信道編碼的主要目的是對抗信道中的噪聲,恰當地引入冗余可以保證即使一部分信號丟失或者失真,接收設備依然可以解碼得到原始消息,從而保證有效的通信。
 
香農認為通信中最基礎的問題是在一處近似或者精確地重現另一處的消息,類似的,我們認為古生物學中最基礎的問題是在現代近似或者精確地重現在地質年代中的古生物,包括它們的演化歷史與形態功能等諸多方面。在古生物學系統發育研究中,絕大多數研究只能依靠形態學數據,與此相反的是,在現代生物或者最近滅絕的生物的系統發育研究中,研究人員可以利用DNA或者蛋白質序列這樣易于數字化的數據。因此,DNA或者蛋白質序列非常接近于現代通信系統中的數字信號,而形態學數據更接近于模擬信號。形態學的數字化通常依靠形態學特征矩陣來完成,但是如何選擇特征,每個特征中有多少信息量,各個特征之間的相關性,這些問題都是模糊不清的。
 
該研究首先計算了多個脊椎動物形態學特征矩陣中每個特征的信息熵(信息量),擁有更多特征狀態的特征有明顯較高的信息熵。對于矩陣中多個特征的聯合信息熵的結果顯示僅僅少數形態學特征即可描述信源信息熵,絕大多數特征并沒有提供額外的信息。這與古脊椎動物學研究中報道新物種的習慣符合,即利用少數特征作為鑒定特征,而在系統發育研究中則會使用數量大得多的特征。類似地,這樣的區別可以用通信系統工程當中的信源與信道編碼過程解釋。進一步地,研究計算了每個特征矩陣中特征對之間的互信息,發現特征之間的相關性廣泛存在,但習慣上對于解剖結構的劃分并沒有體現出較好的模塊性。
 
基于加性高斯白噪聲信道模型,研究估算了不同特征矩陣對應的信道容量,發現信道容量均被特征數量飽和。香農的理論告訴我們超越信道容量的通信速率必然帶來噪聲,而在加性高斯白噪聲信道模型中,隨著帶寬的提高,信道容量并不會無線提高,過寬的帶寬不僅浪費通信資源也無法改善通信的質量。這與目前被研究人員偏愛的超大型特征矩陣相悖。
 
由于信息熵直接度量了單個變量的信息量多少,因此可以在系統發育的特征權重方面提供參考依據。研究比較了平等加權(equal weighting),隱含加權(implied weighting)與信息熵加權在多個脊椎動物類群中的系統發育結果。盡管最終結果十分接近,但信息熵加權由于完全不需要任何先驗知識,且直接建立了特征權重與信息熵之間的關系,比其他加權方式擁有更好的解釋性和更少的額外假設。
 
隨著觀測手段的進步,古生物學家需要處理飛速增加的數據,但目前大量的古生物數據依然依靠研究人員的手工處理。盡管大量的數字化手段已經在古生物學研究中被實踐,例如形態學特征矩陣,基于標志點的形態幾何學,CT掃描等等,如何在海量的數據中尋找我們需要的信息依然是很有挑戰性的工作。利用已經發展成熟的信息論與通信系統工程作為理論基礎,為形態學數據的數字化提供了理論支持,也為基于形態學的系統發育研究提供了指導。正如現代通信系統在數字信號取代模擬信號之后迎來的大發展,未來基于信息論的古生物學有希望幫助我們更好地破解生物演化的密碼。
 
本文第一及通信作者為美國自然歷史博物館古生物部博士研究生余琮煜,共同作者有北京大學博雅博士后江左其杲和中科院古脊椎所副研究員王海冰,參與工作的還有德國漢堡大學與美國自然歷史博物館的科研人員。

相關熱詞搜索:化石

上一篇:藝術與科學的碰撞,帶你走近古生物復原圖的世界——復原圖畫師楊定華專訪
下一篇:《化石記——熱河生物群與燕遼生物群研究與發現》圖書發布活動

分享到: 收藏
亚洲无播放器在线观看_亚洲无播放器网站_亚洲网无码国产_亚洲网络久久国产99
<蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>|