第67章 我的導師不正經?
三天後,離開學還剩五天。
出乎林遠意料的是,OCR那邊提供的兩塊H100竟然還是高配的,特麼的不是入門款的。
因為林遠算法初稿在訓練開始的第三天就出爐了。
對於AI訓練來說,只要模型做得好,算力給到位,那只需要在旁邊栓條狗。
當林遠靠著善用系統解決模型搭建問題,再從OCR那邊白嫖到算力設備之後,一切其實已經算是成了。就像當你手裡握著一把槍的時候,沒必要非得找人打一槍才能證明它的威力。
一切,就是這麼水到渠成。
林遠把算法初稿,連同這稿算法的模擬測試結果,本打算一併提交給好團紫金分部的技術部老大。
在提交之前,由於張教授的特意提醒,林遠先將提交算法的郵件發給了導師。是由導師親自轉發給的好團方面。
郵件裡頭總共兩樣東西,一份概述所用的AI網絡模型,以及記錄訓練過程中的關鍵節點,還有評測結果的PDF文檔。另外一份則是AI網絡模型的核心Python代碼。
具體訓練用到的數據,以及AI模型訓練出的算法實體,由於體積太大,有上百個G(主要是訓練樣本數據太大),自然沒法放入附件之中。
但是,一名合格的從業者只需要看那份PDF文檔上的數據,就能知道林遠這個算法的價值。至於說那上百個G的數據,則是用來證明那份PDF文檔寫的都是真的。這自然是可以後續進行的操作。
至於為啥非要經過導師來提交,林遠一開始也沒想到這茬。薑還是老的辣,想必導師已經見慣了職場的傾軋,生怕林遠被人白嫖了。
導師出馬,人家自然不敢造次。
-----------------
林遠對系統很有信心,他篤定自己提交的那稿算法會引起好團的重視。自己如今只需要等待就可以。
此後麼,就可以和OCR那邊say bye bye啦!
把那個什麼申請專員的微信一刪,老子就當從來沒有過這回事。
可是,也不知道導師是怎麼想的,竟然在算法提交的當天,給林遠特地打了個電話。然後在電話中,二人聊完最重要的算法提交事宜後,導師忽然就提到了OCR算力設備的問題。
「林遠啊,你打算怎麼處置OCR那邊的算力設備。」
「啊?我想,從此和那邊切割。」
「切割?」
聽著導師疑慮的語氣,林遠試探著說道,「我手頭根本沒有證據指正OCR這家機構嘛,不然我一定會舉報它的。」
事實上,林遠就算有證據也不願去趟這種渾水。
「舉報什麼呀。」
「那老師的意思是。。。舉報不成的話,我就直接毀了它?給它來點病毒癱瘓它?」
「思維發散一點嘛。」
林遠一時想不出來該怎麼發散。
「你想想,老師我當年在茶歇上看到那些魚子醬還有黑松露,我是怎麼辦的。」
「那會兒我都還沒出生呢,我哪知道您怎麼辦的呀。」
「用你們年輕人的話來說,你不會腦補嗎?」
「吃?」
張教授自答道,「連吃帶拿。不好拿走的悄悄舔一口。」
「額,,,」林遠有點,,,『這特麼是知識分子能幹出來的事?』
「所以,你明白了吧。」
「我,,,我明白什麼呀?學著您連吃帶拿?再舔一口?」
「對嘍。」
「可我怎麼拿,,,我,,,我拿來挖礦?」
林遠如夢初醒,「對呀,我幹嘛不拿來挖礦呀。」
「就是嘛!」
在經歷了短暫的激動後,林遠隨即意識到一個問題,「兩塊H100是強,可是撐死了就挖個幾天。沒多少錢的吧。」
「咳咳~~」電話那頭傳來一陣咳嗽,隨後張教授才繼續道,「這個嘛,,,如果電費需要你自己掏的話,確實沒幾個錢。」
「學生明白了。有人替我出電費。」林遠愛死了自己這個不正經的導師,張教授真的是對自己言傳身教,沒有藏私啊。林遠都被感動得眼淚汪汪了。一定是導師知道自己太窮,又顧及自己自尊心,所以提醒了自己這麼個發財的路子。
「你就專心挖你的礦。算法的事情,只要你的算法沒問題,該是你的一點也不會少。好團那邊,我替你去張羅。」
挖礦最費錢的其實不是設備,因為設備再貴也是一次性投入,而且重資產本身就是價值。最費錢的其實是電費開支。
林遠大致算了下,憑藉兩塊高版本H100的算力,每天搞它個千把塊總行的吧。
他查過高版本的H100售價,約摸是在30萬左右,兩塊加起來可就是60萬的設備。那在不考慮電費開支的情況下,搞個千把塊總可以的。否則會有什麼傻子願意冒風險去挖礦。
-----------------
於是,林遠終於得以開啟他的挖礦大計。
踏破鐵鞋無覓處無覓處,得來全不費工夫。在企圖用系統挖礦失敗後,林遠終於在導師的提醒下成功另闢蹊徑。
『夏葉,我們孩子的奶粉錢有了。』
-----------------
林遠沒想到自己提交了算法初稿後,接下來乾的竟然是:研究怎麼用OCR的算力設備挖礦。
可高興歸高興,問題也隨之而來了。因為特麼挖礦不是想挖就挖的。
挖礦比拼的就是算力強弱,而計算並非是可以單獨存在的。GPU中實現計算能力的是CUDA計算核心,他們就像一個個加工廠,需要有東西進去才能生產。而進去要被加工的東西就是數據。
那加工廠的生產能力可不僅僅取決於加工廠裡面機器的運轉速度,還取決於運輸快慢--原料被輸送輸出的快慢。
所以,GPU的重要性能指標中,除了主頻之外,還有就是內部內存總線上的帶寬。
這個帶寬就表示了GPU內部工廠輸送東西的快慢。
而為了保證帶寬足夠大,就對GPU的自身顯存有了一定要求。顯存代表著你能緩存數據的總量,可以簡單理解為一座工廠里倉庫的容量。
也正因為此,挖礦才會對GPU的顯存有最低要求。
因為挖礦所要用到的數據就是「帳本」,帳本必須被放入顯存裡面。
林遠懶得去關心帳本的數據構成以及其背後原理,他關心的是:帳本一旦被載入GPU的顯存,那很容易就會被OCR方面掃描出數據特徵。進而就會知道他是在挖礦。
每種數字貨幣的帳本都是有其自身的數據特徵的,因為這個世界上的所有數據都有其特徵,沒有特徵的數據本身就是一堆亂碼。
各種安全軟體光憑數據特徵就能知道你在挖什麼礦。
所以,林遠如今面臨的問題是:怎麼在OCR眼皮子底下挖礦。
哪怕是一天搞個一千塊,那七天下來也有七千塊。這錢不要白不要。
出乎林遠意料的是,OCR那邊提供的兩塊H100竟然還是高配的,特麼的不是入門款的。
因為林遠算法初稿在訓練開始的第三天就出爐了。
對於AI訓練來說,只要模型做得好,算力給到位,那只需要在旁邊栓條狗。
當林遠靠著善用系統解決模型搭建問題,再從OCR那邊白嫖到算力設備之後,一切其實已經算是成了。就像當你手裡握著一把槍的時候,沒必要非得找人打一槍才能證明它的威力。
一切,就是這麼水到渠成。
林遠把算法初稿,連同這稿算法的模擬測試結果,本打算一併提交給好團紫金分部的技術部老大。
在提交之前,由於張教授的特意提醒,林遠先將提交算法的郵件發給了導師。是由導師親自轉發給的好團方面。
郵件裡頭總共兩樣東西,一份概述所用的AI網絡模型,以及記錄訓練過程中的關鍵節點,還有評測結果的PDF文檔。另外一份則是AI網絡模型的核心Python代碼。
具體訓練用到的數據,以及AI模型訓練出的算法實體,由於體積太大,有上百個G(主要是訓練樣本數據太大),自然沒法放入附件之中。
但是,一名合格的從業者只需要看那份PDF文檔上的數據,就能知道林遠這個算法的價值。至於說那上百個G的數據,則是用來證明那份PDF文檔寫的都是真的。這自然是可以後續進行的操作。
至於為啥非要經過導師來提交,林遠一開始也沒想到這茬。薑還是老的辣,想必導師已經見慣了職場的傾軋,生怕林遠被人白嫖了。
導師出馬,人家自然不敢造次。
-----------------
林遠對系統很有信心,他篤定自己提交的那稿算法會引起好團的重視。自己如今只需要等待就可以。
此後麼,就可以和OCR那邊say bye bye啦!
把那個什麼申請專員的微信一刪,老子就當從來沒有過這回事。
可是,也不知道導師是怎麼想的,竟然在算法提交的當天,給林遠特地打了個電話。然後在電話中,二人聊完最重要的算法提交事宜後,導師忽然就提到了OCR算力設備的問題。
「林遠啊,你打算怎麼處置OCR那邊的算力設備。」
「啊?我想,從此和那邊切割。」
「切割?」
聽著導師疑慮的語氣,林遠試探著說道,「我手頭根本沒有證據指正OCR這家機構嘛,不然我一定會舉報它的。」
事實上,林遠就算有證據也不願去趟這種渾水。
「舉報什麼呀。」
「那老師的意思是。。。舉報不成的話,我就直接毀了它?給它來點病毒癱瘓它?」
「思維發散一點嘛。」
林遠一時想不出來該怎麼發散。
「你想想,老師我當年在茶歇上看到那些魚子醬還有黑松露,我是怎麼辦的。」
「那會兒我都還沒出生呢,我哪知道您怎麼辦的呀。」
「用你們年輕人的話來說,你不會腦補嗎?」
「吃?」
張教授自答道,「連吃帶拿。不好拿走的悄悄舔一口。」
「額,,,」林遠有點,,,『這特麼是知識分子能幹出來的事?』
「所以,你明白了吧。」
「我,,,我明白什麼呀?學著您連吃帶拿?再舔一口?」
「對嘍。」
「可我怎麼拿,,,我,,,我拿來挖礦?」
林遠如夢初醒,「對呀,我幹嘛不拿來挖礦呀。」
「就是嘛!」
在經歷了短暫的激動後,林遠隨即意識到一個問題,「兩塊H100是強,可是撐死了就挖個幾天。沒多少錢的吧。」
「咳咳~~」電話那頭傳來一陣咳嗽,隨後張教授才繼續道,「這個嘛,,,如果電費需要你自己掏的話,確實沒幾個錢。」
「學生明白了。有人替我出電費。」林遠愛死了自己這個不正經的導師,張教授真的是對自己言傳身教,沒有藏私啊。林遠都被感動得眼淚汪汪了。一定是導師知道自己太窮,又顧及自己自尊心,所以提醒了自己這麼個發財的路子。
「你就專心挖你的礦。算法的事情,只要你的算法沒問題,該是你的一點也不會少。好團那邊,我替你去張羅。」
挖礦最費錢的其實不是設備,因為設備再貴也是一次性投入,而且重資產本身就是價值。最費錢的其實是電費開支。
林遠大致算了下,憑藉兩塊高版本H100的算力,每天搞它個千把塊總行的吧。
他查過高版本的H100售價,約摸是在30萬左右,兩塊加起來可就是60萬的設備。那在不考慮電費開支的情況下,搞個千把塊總可以的。否則會有什麼傻子願意冒風險去挖礦。
-----------------
於是,林遠終於得以開啟他的挖礦大計。
踏破鐵鞋無覓處無覓處,得來全不費工夫。在企圖用系統挖礦失敗後,林遠終於在導師的提醒下成功另闢蹊徑。
『夏葉,我們孩子的奶粉錢有了。』
-----------------
林遠沒想到自己提交了算法初稿後,接下來乾的竟然是:研究怎麼用OCR的算力設備挖礦。
可高興歸高興,問題也隨之而來了。因為特麼挖礦不是想挖就挖的。
挖礦比拼的就是算力強弱,而計算並非是可以單獨存在的。GPU中實現計算能力的是CUDA計算核心,他們就像一個個加工廠,需要有東西進去才能生產。而進去要被加工的東西就是數據。
那加工廠的生產能力可不僅僅取決於加工廠裡面機器的運轉速度,還取決於運輸快慢--原料被輸送輸出的快慢。
所以,GPU的重要性能指標中,除了主頻之外,還有就是內部內存總線上的帶寬。
這個帶寬就表示了GPU內部工廠輸送東西的快慢。
而為了保證帶寬足夠大,就對GPU的自身顯存有了一定要求。顯存代表著你能緩存數據的總量,可以簡單理解為一座工廠里倉庫的容量。
也正因為此,挖礦才會對GPU的顯存有最低要求。
因為挖礦所要用到的數據就是「帳本」,帳本必須被放入顯存裡面。
林遠懶得去關心帳本的數據構成以及其背後原理,他關心的是:帳本一旦被載入GPU的顯存,那很容易就會被OCR方面掃描出數據特徵。進而就會知道他是在挖礦。
每種數字貨幣的帳本都是有其自身的數據特徵的,因為這個世界上的所有數據都有其特徵,沒有特徵的數據本身就是一堆亂碼。
各種安全軟體光憑數據特徵就能知道你在挖什麼礦。
所以,林遠如今面臨的問題是:怎麼在OCR眼皮子底下挖礦。
哪怕是一天搞個一千塊,那七天下來也有七千塊。這錢不要白不要。