第91章 極其實用的證明(求追讀)
之後的一個月,江銘又過上了甩手掌柜的生活。
整個公司的運營交給了朱宇,代碼任務的分配和把關由齊昊皓全權負責。
他則是繼續躲在宿舍里肝論文,時不時熬個通宵,純靠系統出品的能量棒來補充體力。
他也不清楚自己為什麼這麼拼,自從接受了信息學Lv2的晉升任務之後,總是心裡有種緊迫感。
好在這個能量棒似乎也沒什麼副作用,每次熬夜困了的時候嗑一支,又能活力滿滿地再奮鬥仨小時。
終於在七月的中旬,江銘寫完了兩篇二十多頁的論文,並且一股腦地發給了Nature的編輯。
自從上次發布策略梯度算法之後,江銘就和Nature主編之一的達倫·柯林斯通過郵箱聯繫上了。
對方還親切地邀請江銘這位來自東方的朋友,有空一定要去日不落帝國的首都倫敦體驗一下那邊自由的科研氛圍。
江銘的論文剛發過去不到一個小時,對方的電話就打了個過來。
電話剛一接通,對面就傳來極為激動的聲音:「噢我的上帝啊,我親愛的江銘小友,你發來的論文簡直太震撼了!」
江銘默不作聲地把電話往遠挪了挪,光聽電話就能感受到達倫主編的熱情仿佛要從手機里里溢出來。
而且這看論文的速度也太快了,除非是自己發過去之後立馬就開始看了,他難道是給自己的郵箱帳號加了特別關注嗎?
「我之前以為你只會發給我那篇上了全藍星新聞頭條的圍棋程序,沒想到還有一個重磅成果一同發了過來,甚至比圍棋還令我震撼許多!」
「你這個蛋白質結構預測,簡直是要徹底改變生命科學研究界的格局了!我終於知道為什麼你們華國最近在生命科學領域做了那麼多大動作。」
「天啊,你半夜給我發論文,我看完之後簡直是要睡不著了。我剛剛已經電話聯繫了信息學的那些個教授做同行評議,必須讓他們和我一樣睡不著!」
江銘沒來得及回應,對方的聲音還在如同連珠炮一般不帶喘氣地傳過來。
「我可以和你打包票,這兩篇文章必定能見刊,唯一讓我糾結的是到底選你這兩篇的哪篇做封面,江銘小友你來幫我選吧。」
「額...達倫主編,這個我覺得都可以,能見刊就行。」,江銘倒是無所謂,反正只要能上Nature幫他完成任務就好。
「哈哈哈我想到了!就兩篇一起當封面怎麼樣?我找設計師好好設計一下,整個封面的左上一半是你的圍棋程序,右下一半是蛋白質結構預測,這聽起來就是個不錯的主意。」
「你再這麼投下去,我真是害怕以後自然雜誌都要給你開個信息學的子刊了,叫什麼Nature Artificial Intelligence之類的。」
「行了,不和你說了,就是來恭喜你一下,我得趕緊去給下屬們安排任務了。」
「好滴,主編辛苦了。」,江銘乖巧地道。
掛掉電話,江銘的視野側面立刻彈出了提示。
【恭喜持有者完成任務:通曉百家。】
【微電子工程學已提升至Lv1。】
【物理學已提升至Lv1。】
【生物學已提升至Lv1。】
【恭喜獲得藍色抽獎券一張。】
看著自己瞬間提升的三學科等級,江銘頓時喜笑顏開。
這樣一來,他的全部學科又都站在了同一起跑線。
不過這也意味著自己如果信息學遲遲無法突破的話,其他的學科就會永遠被卡在Lv1無法寸進。
江銘頓時有些發愁。
信息學晉升Lv2的幾個任務還沒一點眉目。
無論如何,先把任務完成的獎抽了吧!
「系統,我要抽獎!」
江銘在心中默念。
【恭喜抽中,精品級理論:最優控制問題無損凸優化解的等價性證明。】
幾乎是一瞬間,一大段信息不斷湧入他的腦海,江銘頓時眼冒金星,但堅持著把信息全部接收完成。
他好一會兒才緩過來,這才閉上眼睛,在頭腦中細細查看剛剛得到的理論。
半響,他的眼睛忽地睜開,露出赫然的表情。
這個證明雖然不像證明數學界幾大猜想那樣足以載入史冊,但它有著極其強悍的實用性!
整篇證明闡述了在最優控制問題中,通過引入額外的優化變量來重構非凸約束,使原本的非凸約束轉換成凸區域,從而可以讓原本的非凸問題重新表述為高維的凸問題!
而在控制系統中,控制問題的凸性是極其重要的,因為凸問題有一個非常好的性質,即局部最優解也是全局最優解。
這意味著在求解凸問題的時候,任何梯度下降或次梯度下降的方法都能保證找到全局最優!
之前江銘依靠策略梯度算法讓一個控制器不斷在模擬環境中試錯,從而用神經網絡擬合最優控制函數雖然也很可行,但是問題也很明顯。
首先是模擬環境和真實環境很可能存在偏差,比如對氣流風阻的模擬受到現有技術的制約,和真實情況相差甚遠。
這也是為什麼無論是設計飛行器還是建築,都需要進行一步風洞測試,來真的在現實環境中評估穩定性。
其次是神經網絡擬合的方法同樣會陷入局部最優,因為問題本身是非凸問題,智能體很容易因為路徑依賴性陷入局部最優。
這就像是做題,雖然做難的題做對了分數更高,但是由於錯的概率更大,智能體很容易就陷在不斷刷簡答題的次優策略里。
而這個證明卻給最優控制問題提供了全新的思路,它定義了一個「正則系統」,只需要通過構造Hamilton函數並利用龐特里亞金最大化原理,即可確保Hamilton函數在鬆弛可行控制集的投影極點處最大化來建立無損凸化。
江銘的拳頭攥緊又放鬆,激動得臉色通紅。
他如今在數學和控制學的知識足夠充足,輕易便理解了這個理論證明的深遠影響。
有了這個證明,別說什麼自適應巡航了,無論是飛機還是火箭,僅僅依靠數學就能計算出一套控制函數,讓它以任意的姿態飛行。
這簡直是無數航天動力學與控制科學的研究員所夢寐以求的理論!
如果再參加一次綜藝,江銘能靠這個理論秒殺任何選手,就是彭城教授親自來都得甘拜下風。
整個公司的運營交給了朱宇,代碼任務的分配和把關由齊昊皓全權負責。
他則是繼續躲在宿舍里肝論文,時不時熬個通宵,純靠系統出品的能量棒來補充體力。
他也不清楚自己為什麼這麼拼,自從接受了信息學Lv2的晉升任務之後,總是心裡有種緊迫感。
好在這個能量棒似乎也沒什麼副作用,每次熬夜困了的時候嗑一支,又能活力滿滿地再奮鬥仨小時。
終於在七月的中旬,江銘寫完了兩篇二十多頁的論文,並且一股腦地發給了Nature的編輯。
自從上次發布策略梯度算法之後,江銘就和Nature主編之一的達倫·柯林斯通過郵箱聯繫上了。
對方還親切地邀請江銘這位來自東方的朋友,有空一定要去日不落帝國的首都倫敦體驗一下那邊自由的科研氛圍。
江銘的論文剛發過去不到一個小時,對方的電話就打了個過來。
電話剛一接通,對面就傳來極為激動的聲音:「噢我的上帝啊,我親愛的江銘小友,你發來的論文簡直太震撼了!」
江銘默不作聲地把電話往遠挪了挪,光聽電話就能感受到達倫主編的熱情仿佛要從手機里里溢出來。
而且這看論文的速度也太快了,除非是自己發過去之後立馬就開始看了,他難道是給自己的郵箱帳號加了特別關注嗎?
「我之前以為你只會發給我那篇上了全藍星新聞頭條的圍棋程序,沒想到還有一個重磅成果一同發了過來,甚至比圍棋還令我震撼許多!」
「你這個蛋白質結構預測,簡直是要徹底改變生命科學研究界的格局了!我終於知道為什麼你們華國最近在生命科學領域做了那麼多大動作。」
「天啊,你半夜給我發論文,我看完之後簡直是要睡不著了。我剛剛已經電話聯繫了信息學的那些個教授做同行評議,必須讓他們和我一樣睡不著!」
江銘沒來得及回應,對方的聲音還在如同連珠炮一般不帶喘氣地傳過來。
「我可以和你打包票,這兩篇文章必定能見刊,唯一讓我糾結的是到底選你這兩篇的哪篇做封面,江銘小友你來幫我選吧。」
「額...達倫主編,這個我覺得都可以,能見刊就行。」,江銘倒是無所謂,反正只要能上Nature幫他完成任務就好。
「哈哈哈我想到了!就兩篇一起當封面怎麼樣?我找設計師好好設計一下,整個封面的左上一半是你的圍棋程序,右下一半是蛋白質結構預測,這聽起來就是個不錯的主意。」
「你再這麼投下去,我真是害怕以後自然雜誌都要給你開個信息學的子刊了,叫什麼Nature Artificial Intelligence之類的。」
「行了,不和你說了,就是來恭喜你一下,我得趕緊去給下屬們安排任務了。」
「好滴,主編辛苦了。」,江銘乖巧地道。
掛掉電話,江銘的視野側面立刻彈出了提示。
【恭喜持有者完成任務:通曉百家。】
【微電子工程學已提升至Lv1。】
【物理學已提升至Lv1。】
【生物學已提升至Lv1。】
【恭喜獲得藍色抽獎券一張。】
看著自己瞬間提升的三學科等級,江銘頓時喜笑顏開。
這樣一來,他的全部學科又都站在了同一起跑線。
不過這也意味著自己如果信息學遲遲無法突破的話,其他的學科就會永遠被卡在Lv1無法寸進。
江銘頓時有些發愁。
信息學晉升Lv2的幾個任務還沒一點眉目。
無論如何,先把任務完成的獎抽了吧!
「系統,我要抽獎!」
江銘在心中默念。
【恭喜抽中,精品級理論:最優控制問題無損凸優化解的等價性證明。】
幾乎是一瞬間,一大段信息不斷湧入他的腦海,江銘頓時眼冒金星,但堅持著把信息全部接收完成。
他好一會兒才緩過來,這才閉上眼睛,在頭腦中細細查看剛剛得到的理論。
半響,他的眼睛忽地睜開,露出赫然的表情。
這個證明雖然不像證明數學界幾大猜想那樣足以載入史冊,但它有著極其強悍的實用性!
整篇證明闡述了在最優控制問題中,通過引入額外的優化變量來重構非凸約束,使原本的非凸約束轉換成凸區域,從而可以讓原本的非凸問題重新表述為高維的凸問題!
而在控制系統中,控制問題的凸性是極其重要的,因為凸問題有一個非常好的性質,即局部最優解也是全局最優解。
這意味著在求解凸問題的時候,任何梯度下降或次梯度下降的方法都能保證找到全局最優!
之前江銘依靠策略梯度算法讓一個控制器不斷在模擬環境中試錯,從而用神經網絡擬合最優控制函數雖然也很可行,但是問題也很明顯。
首先是模擬環境和真實環境很可能存在偏差,比如對氣流風阻的模擬受到現有技術的制約,和真實情況相差甚遠。
這也是為什麼無論是設計飛行器還是建築,都需要進行一步風洞測試,來真的在現實環境中評估穩定性。
其次是神經網絡擬合的方法同樣會陷入局部最優,因為問題本身是非凸問題,智能體很容易因為路徑依賴性陷入局部最優。
這就像是做題,雖然做難的題做對了分數更高,但是由於錯的概率更大,智能體很容易就陷在不斷刷簡答題的次優策略里。
而這個證明卻給最優控制問題提供了全新的思路,它定義了一個「正則系統」,只需要通過構造Hamilton函數並利用龐特里亞金最大化原理,即可確保Hamilton函數在鬆弛可行控制集的投影極點處最大化來建立無損凸化。
江銘的拳頭攥緊又放鬆,激動得臉色通紅。
他如今在數學和控制學的知識足夠充足,輕易便理解了這個理論證明的深遠影響。
有了這個證明,別說什麼自適應巡航了,無論是飛機還是火箭,僅僅依靠數學就能計算出一套控制函數,讓它以任意的姿態飛行。
這簡直是無數航天動力學與控制科學的研究員所夢寐以求的理論!
如果再參加一次綜藝,江銘能靠這個理論秒殺任何選手,就是彭城教授親自來都得甘拜下風。