遺傳算法的哲學思考

簡體傳統

　　中圖分類號：N02　文獻標識碼：A　文章編號：1003-5680(2007)06-0043-04
　　制造智能機器一直是人類的夢想，人們為此進行了艱苦卓絕的探索，人工智能技術的發展使這一夢想逐步向現實邁進。傳統的人工智能基于符號處理機制，在人工智能史上發揮過重大作用，但是，近年來，隨著人工智能應用領域的不斷拓展，這條強人工智能的進路在處理模式信息與非線性復雜系統，以及解決組合爆炸等方面的問題遇到了難以克服的困難。之后，神經網絡的發展，形成了人工智能的聯結主義研究范式。這條進路雖然對于解決非線性復雜問題具有突破性的進展，但仍有許多局限。遺傳算法的行為主義工作范式為人工智能研究開辟了新的途徑與方法，對于復雜非結構性問題的認知具有很重要的啟示和認知意義。國內目前主要集中于對遺傳算法理論及應用的研究，對其認知意義的揭示需要進一步加強。文章試圖基于對遺傳算法的產生背景及其思想特點的考察，從微觀層面探討遺傳算法對于復雜科學認知的方法論意義。
　　一　遺傳算法的產生和發展
　　遺傳算法是基于達爾文生物進化論的自然選擇學說和群體遺傳學原理而開發出的一種隨機全局搜索與優化的自適應智能算法。它主要采用信息數學模型來模擬自然生命系統在與環境信息的互動中進行自適應優化的一種遺傳進化行為。遺傳算法目前已經在模式識別、圖像處理、神經網絡、機器學習、工業優化控制、自適應控制、生物科學、社會科學等方面都得到廣泛應用。它是20世紀下半葉學科高度交叉融合的結果，其產生和發展過程可大致分為以下三個階段。[1]
　　遺傳算法起源于對生物系統所進行的計算機模擬研究。在上世紀40年代和50年代，人工智能研究者在工程實踐中發現，傳統計算解題方式難以適應復雜性問題研究。于是，他們開始嘗試利用計算機進行生物模擬技術的研究，從生物學的角度進行對生物的進化過程和遺傳過程的模擬。1962年，弗蘭瑟(A.S.Fraser)在《理論生物學雜志》上發表了“遺傳系統的模擬”一文，其思想和現在的遺傳算法十分相似，但是，他并未意識到將自然遺傳算法轉化為人工遺傳算法。與此同時，美國密執安大學的霍蘭(J.H.Holland)認識到了這種轉化的重要性，認識到生物的遺傳和自然進化現象與人工自適應系統之間的相似關系，提出了一種利用群體進化的方法進行自適應搜索模擬適應性系統的思想，并引進了群體、適應值、選擇、交叉、變異等基本概念。他的工作對于遺傳算法具有開創性的意義，被尊稱為“遺傳算法之父”，此后霍蘭一直致力于遺傳算法和復雜自適應研究。1967年，他的學生巴格里(J.D.Bagely)在其博士論文中首次提出了“遺傳算法”一詞，并發表了遺傳算法應用方面的第一篇論文，提出了復制、交叉、變異、顯性、倒位等遺傳算子，在個體編碼上使用了雙倍體的編碼方法。這些都與目前遺傳算法中所使用的算子方法相類似，他還敏銳地意識到了在遺傳算法執行的不同階段可以使用不同的選擇率，這將有利于防止遺傳算法的早熟現象，從而形成了自適應遺傳算法的概念。
　　70年代初，霍蘭提出遺傳算法的基本定理——模式定理，從而奠定了遺傳算法的理論基礎。1975年，霍蘭出版了第一本系統論述遺傳算法和人工自適應系統的專著《自然與人工系統中的適應性行為》，該書系統地闡述了遺傳算法的基本理論和方法。同年，德·瓊(De Jong)在其博士論文中結合模式定理進行了大量純數值函數優化計算實驗，首次把遺傳算法應用于函數優化問題，他確定了在大多數優化問題中都較適用的遺傳算法的參數，形成了遺傳算法的工作框架，得到了一些重要且具有指導意義的結論，并建立了著名的De Jong五函數測試平臺。80年代初，霍蘭第一個實現了基于遺傳算法的機器學習系統——分類器系統，提出了基于遺傳算法的機器學習的新概念，從而為分類器系統構造出了一個完整的框架。1989年，哥得博(David Goldberg)出版的《搜索、優化和機器學習中的遺傳算法》一書，全面系統地總結了當時關于遺傳算法的主要研究成果，結合大量的實例，完整地論述了遺傳算法的基本原理及應用，奠定了現代遺傳算法的基礎。
　　90年代，遺傳算法在廣度和深度方面都得到了不斷的發展。1991年，戴維斯(L.Davis)編輯出版的《遺傳算法手冊》一書中包括了遺傳算法在科學計算、工程技術和社會經濟中的大量應用實例，這本書為遺傳算法的應用推廣起了重要的推動作用。1992年，寇冉(John R.Koza)在出版《遺傳編程》一書中闡述了遺傳編程的概念，成功地把遺傳編程的方法應用于人工智能、機器學習、符號處理等方面。遺傳算法與其他智能計算方法結合、交叉、滲透是現階段遺傳算法研究的焦點。遺傳算法與模糊數學、神經網絡、混沌等理論相結合，優劣互補，產生了明顯的優化效應，對于智能計算方法具有重要意義；遺傳算法與組合優化方法相結合，解決了許多組合優化難題；遺傳算法與機器學習相結合，解決了專家系統中的分類器設計問題及其他知識工程的知識獲取問題；遺傳算法與并行處理相結合，發展了并行遺傳算法，并促進了智能計算機體系結構的研究進展；遺傳算法與人工生命相結合，發展了各種人工生命系統；遺傳算法與計算機科學相結合，利用計算機網絡和智能體，完善了各種基于多智能體的網絡合作系統，有利于解決復雜的工程問題。
　　二　遺傳算法的內在機理及其特點
　　遺傳算法特別適用于處理傳統人工智能解題方法難于解決的復雜的非線性問題。它模擬了生物進化過程中發生的繁殖、交配、遺傳和變異現象，根據適者生存、優勝劣汰的自然法則，在遺傳算子（選擇、交叉、變異）的作用下，使種群逐代優化，產生優秀個體，最終搜索到最優解。基本的遺傳算法由初始化、選擇、交叉、變異四個部分組成，其流程結構如下圖所示：
　　

　　遺傳算法基本流程
　　遺傳算法模擬生物的群體生存機制，需要先選擇一組初始種群解，它的突出特點是其操作對象不再是問題決策變量的實際值，而是其信息碼，因此，要將待尋優的可行解編碼成“染色體串”。染色體中的基因是最基本的單位，用一個二進制碼或其他信息碼表示，每個染色體代表了搜索空間的可行解即染色體的表現型。然后，染色體要譯碼成實際值計算其適應度。按照適者生存和優勝劣汰的原理，適應度愈大的染色體被選擇的幾率愈大，遺傳到下一代的幾率也愈大。染色體群體中的個體兩兩隨機配對交叉互換部分基因形成新一代群體，同時部分基因可能發生突變，這樣就得到下一代染色體群體，再進行適應度計算，若收斂于最優解，遺傳計算便結束，輸出最優解，否則繼續重復上述選擇、交叉、變異，再進行迭代計算。在這個過程中，像自然進化一樣，群體的后代種群比前代種群更適應于環境，尤其是改進的遺傳算法可逐步趨于最優化。遺傳算法是一類可用于復雜系統優化計算的魯棒搜索算法，與其他一些優化算法相比，它主要有以下幾個顯著特點：[2]
　　其一，遺傳算法將決策變量轉化成信息碼進行操作。傳統的優化算法往往直接利用決策變量的實際值來進行優化計算，而遺傳算法則以決策變量的某種形式的編碼為運算對象。這種信息碼的處理方式，使得信息的交換和流動更為靈活與方便。這樣，在優化計算過程中便可以借鑒生物學中的染色體和基因等概念，可以模仿自然界中生物的遺傳和進化等機理，方便地進行遺傳進化行為操作。信息碼處理方式對于一些無數值概念或者很難有數值概念而只有代碼概念的優化問題，更顯示了獨特的優越性。
　　其二，遺傳算法直接以目標函數作為搜索信息，不需要其他輔助信息。傳統的優化算法不僅需要利用目標函數值，而且往往需要目標函數的導數值等其他一些輔助信息，才能確定搜索方向。遺傳算法群體操作的特點使得它僅使用由目標函數值變換來的適應度函數值，就可確定進一步的搜索方向和搜索范圍，無需目標函數的導數值等其他一些輔助信息。這個特性對很多目標函數無法或很難求導或導數不存在的復雜問題尤為重要，而且，利用目標函數值，可以直接將搜索范圍集中到適應度較高的部分搜索空間，從而提高搜索效率。
　　其三，遺傳算法使用群體性的搜索方式。傳統的優化算法往往是單點操作，從解空間中的一個初始點開始最優解的迭代搜索過程，單點搜索所提供的搜索信息有限，所以搜索效率不高，而且常常使搜索過程陷于局部最優解而停滯不前。遺傳算法是一種群體行為操作，從由很多個個體所組成的一個初始群體開始最優解的搜索過程，對這個群體進行的選擇、交叉、變異等運算所產生的新一代群體中會包括很多信息，這些信息可以避免搜索一些不必搜索的點，所以，實際上相當于搜索了更多的點，這是遺傳算法所特有的一種隱含并行性。
　　其四，遺傳算法的操作不是采用確定性的規則，而是使用概率搜索技術。傳統的優化算法往往使用的是確定性的搜索方法，一個搜索點到另一個搜索點的轉移有確定的轉移方法和轉移關系，這種確定性往往也有可能使得搜索永遠達不到最優點，降低了算法的可操作性。而遺傳算法屬于一種自適應概率搜索技術，其選擇、交叉、變異等運算都以一種概率的方式進行，從而增加了其搜索過程的靈活性，當然這種概率特性也會使群體中產生一些適應度不高的個體，但隨著進化過程的進行，新的群體中總會更多地產生出許多優良的個體，實踐和理論都已證明在一定條件下遺傳算法總是以概率1收斂于問題的最優解。
　　為直觀起見，作一圖表來比較：

算法操作特點    遺傳算法         傳統優化算法操作對象     決策值的信息碼      決策值本身搜索信息     目標函數值          目標函數值及其他輔助信息搜索方式     群體性搜索          單點搜索操作規則     概率不確定規則      確定性規則

　　由上述特點可見，遺傳算法的工作方式與傳統程序式的計算求解工作方式有很大不同，這些特點使其具有更強的自組織、自適應和學習性。在求解問題時，當編碼方案、適應度函數及遺傳算子確定后，遺傳算法將利用進化過程中獲得的信息自行組織搜索，它采用“適者生存”的自然選擇策略，因為適應度大的個體具有較高的生存概率和更適應環境的基因結構。然后，通過基因重組和基因突變等遺傳操作，就可能產生更適應環境的后代。這種自組織、自適應特征，使它同時具有能根據環境變化來自動發現環境的特性和規律的能力。遺傳算法利用主體對環境的這種適應與選擇的方式消除了算法設計過程中的一個最大障礙：即，需要事先描述問題的全部特點，并要說明針對問題的不同特點算法應采取的措施。[3]遺傳算法的這種工作范式被稱為行為主義，這種工作范式非常適合于解決復雜的非結構性問題，對于人工智能和認知科學具有重要啟示。
　　三　遺傳算法的工作范式及認知意義
　　歷史地看，人工智能主要有符號主義、聯結主義、行為主義三大流派。人工智能的符號主義工作范式是把符號看成是人們認識客觀世界的認知基元，試圖運用計算機的推理程序解決現實世界中的許多問題。符號主義進路沿襲經典科學的認知方式，其基本理念是，以邏輯推理為前提，把知識與世界都看成是確定性的，認為只要找到初始條件，根據推理規則便能推算出世界的未來。所以，其核心問題是研究如何用謂詞邏輯來進行知識表達、知識推理和知識運用。其邏輯出發點是面對容易進行結構分解的規則系統，用特定的符號表征特定的意義，讓特定的結構發揮特定的功能。然后，根據控制規則進行編程處理。但是，人類認知并非僅靠邏輯推理，非邏輯推理（比如，形象思維）同樣占據著非常重要的地位。當面對復雜的非線性系統時，符號主義進路對系統結構的分析是很困難的。這是因為，在非線性系統內部，不僅元素間的關系錯綜復雜，眾多元素相互牽扯，難于簡化和抽象，而且，系統的發展變化不是確定性的。因此，用線性解析的方法對不確定性知識控制規則的尋找幾乎是不可能的。
　　人工智能的聯結主義工作范式把神經元看成是人類思維的基元，試圖基于對大腦神經網絡系統的智能活動的研究來解決符號主義的邏輯推理難以應對的非線性問題。因此，這條進路不要求進行知識表達和知識推理，而是關注神經元之間的整體關聯，或者說，它關注大腦的結構和工作機理，以犧牲單個神經元的個體性為代價來獲得整個神經網絡的協調統一，其最明顯的優勢在于形象化的聯想思維。神經網絡的發展為認知科學研究提供了重要工具，它從大腦結構和工作模式出發，開啟了人工智能學習能力的研究。但是，大腦的學習系統是一個自協調的開放系統，是進化的活的有機體的智能中心。所以，要對大腦的智能進行模擬就不可避免地要模擬大腦的開放與進化能力，模擬大腦因環境而異的應激反應能力和大腦對于行為的協調控制。然而，在這方面，聯結主義進路能力有限。
　　遺傳算法立足于過程生成論的哲學立場，運用信息數學模型，通過模擬自然生命系統中“適者生存”的進化機制，使一組群體在與環境信息的不斷互動下進行行為調整，實現適應環境和優化結構的進化目標。這是一種典型的行為主義的工作范式。這條進路首先把整個群體系統看作是一個動態的、活的開放系統，不再尋求靜態的結構表征，也不需要有知識表達和知識推理。然后，模擬群體在主動適應環境的過程中進行選擇、交叉、變異時通過信息的整合而產生向目標進化的行為。它有三個典型的特征：其一，與人工智能的聯結主義一樣，也不要求進行知識表達與知識推理；其二，認為人工智能與人類智能一樣，也是通過進化逐步提高的；其三，認為這種進化的實現取決于主體與其環境之間的交互作用。遺傳算法的提出為含有隨機因素的不確定的開放系統提供了一種通用的算法框架。
　　傳統的優化算法往往是利用一個個體進行最優解的迭代搜索，在這個過程中只能是個體自身不斷學習更新積累信息，所以，效率不高。聯結主義也是如此，它是將單點分解成若干神經元，具有并行性，但是，搜索依然依賴于自身信息，它的進化需要在環境中不斷地自我反饋自我修正，因此，對環境信息要求很高，例如，BP神經網絡雖然具有強大的非線性優化搜索能力，但是，目標函數要求是連續可導的。而遺傳算法選擇一組群體開始多點搜索，這種進化是群體意義上的進化，是個體與個體之間進行比較、競爭和信息交換，個體間既有競爭，又有協作，不需要自我反饋，這使得系統本身不需要太多地依賴于環境提供的信息，從而具備了更強的自適應能力。遺傳算法與神經網絡一樣都注重群體的整體信息，不需要像傳統符號加工方式那樣對系統進行線性分解。不同之處在于，神經網絡是將個體看作一個由許多神經元組成的整體，單個神經元沒有意義，它相當于是個體自身部件的進化而促成自身的適應，這使得它缺少一種靈活性。而遺傳算法中的每個個體都有自己的表現型和自身的意義，因此由個體組成的群體信息豐富并且不斷涌現新的信息，這樣，群體在與環境的相互作用中便可以獲得很多適應信息，為下一代在環境中的適應生存儲存了豐富的資源。因此，遺傳算法不是以一種解構的方式去分析復雜系統，而是以一種適應的方式建構適應性主體自身的復雜性，包括復雜的結構和復雜的應變能力。以遺傳算法為基礎提出的“復雜自適應系統”（簡稱CAS）理論的提出，形成了適應性造就復雜性的思想。
　　遺傳算法的理論基礎是模式定理和積木塊假設。模式定理指出，在遺傳算子選擇、交換、變異的作用下，具有低階、短定義距以及平均適應度高于群體平均適應度的模式，在子代中，將得以指數級增長。這里的模式相當于基因片段或適應規則。積木塊假設是指，低階、短距、高平均適應度的模式（積木塊）在遺傳算子作用下，相互結合能形成高階、長距、高平均適應度的模式，最終生成全局最優解。這表明，適應性主體最初的內部模型并不復雜。群體由多樣的簡單個體組成，它對環境的適應性在于把這種多樣的簡單性整合成了復雜性。每個個體的行為其實只是簡單的“如果……則……”的刺激反應行為，但是眾多個體簡單的行為通過相互作用的迭代運作和歷時演化卻涌現出了復雜性。[4]對于每一次環境的反饋，作為具有主動性的適應性主體都會通過選擇、交叉和變異主動地對其內部結構進行調整，選擇使得優秀基因片段大量繁殖，交叉使得高適應度的基因逐漸積累組合，變異維持了群體多樣性，防止了早熟。選擇、交叉、變異在計算機中雖然是看似簡單的機械操作，但是，在這個過程中卻處理了大量復雜的非線性信息，在這種黑匣子式的處理過程中，大量的數據和信息在漲落中逐漸趨于有序。我們知道，在通常情況下，復雜系統中的底層次和高層次的一些信息比較容易獲得，而中間的轉化層次的信息獲得比較困難，遺傳算法提供了自下而上、由簡單涌現復雜的層次轉化的模擬機制，從而有助于獲得在宏觀與微觀之間的轉化層的信息。
　　霍蘭曾經在用遺傳算法實現的機器學習系統中，引入一個類似于認知科學中的“小妖模型”，在這個模型中，他讓主體之間通過拍賣競爭的機制進行相互作用，并運用“傳遞水桶算法”使每個主體的行為得以反饋，形成適應環境的學習行為，從而使系統擁有開采式學習能力和探險式學習能力。[5]在這個學習系統中，不僅適應性主體的內部模型在進化，而且其學習能力也在進化。由此可見，遺傳算法的提出極大地推動了人工生命的研究進程，有助于模擬大腦的動態學習能力，具有明顯的認知意義，從而為認知科學的發展提供了方法論的啟迪，為人們認識復雜系統演化的內在機制提供了一個新的視角，說明了在生物系統的選擇進化過程中，最基本的由本能決定的價值判斷，會在系統演化的過程中，通過協調進化的自適應性學習能力的提高，逐漸地建構出復雜的價值判斷。顯然，遺傳算法所模擬的這種適應性進化的學習能力，實際上，突出與強調了生物系統生存與演化的語境依賴性。因此，可以認為，人工智能的行為主義的發展，為科學哲學中語境實在論的思想提供了現實的案例支持。
　　綜上所述，遺傳算法目前正在應用中不斷地趨于完善，它提供了把人類適應行為與機器適應行為聯系起來的紐帶，其思想對于人工智能和認知科學具有深遠的方法論與認識論意義。但是，它也有明顯局限性，比如，推理能力較弱。因此，在當前的人工智能研究中，出現了將人工智能的三種流派有機地結合起來，以達到優勢互補的趨勢。人工智能的符號主義希望呈現一個大腦，聯結主義希望構造一個大腦，行為主義則希望進化一個大腦，也許將這三個大腦整合成一個大腦，有可能會展現一個立體的大腦。
　　科學技術與辯證法太原43～46B2科學技術哲學成素梅/郝中華20082008
遺傳算法/符號主義/聯結主義/行為主義
遺傳算法是基于生物進化論的“適者生存”機制和群體遺傳學原理而開發出的一種隨機全局搜索與優化的自適應智能算法。經過半個世紀的發展它逐漸趨于成熟，具有許多優點。它彌補了人工智能的符號主義與聯結主義的缺陷，提供了對群體行為的協調性自適應學習能力的模擬方法，對認知科學的發展具有重要的認識論與方法論意義，也為科學哲學中語境實在論思想提供了一個現實的案例支持。
作者：科學技術與辯證法太原43～46B2科學技術哲學成素梅/郝中華20082008
遺傳算法/符號主義/聯結主義/行為主義

網載 2013-09-10 21:22:20

[新一篇] 追問生命——張藝謀電影的哲學思考及美學表現

[舊一篇] 郭店楚簡《老子》的美學意義　　——老子美學再認識