您正在瀏覽的是香港網站,香港證監會BJA907號,投資有風險,交易需謹慎
市場資訊

市場資訊

首頁市場資訊資訊詳情

夜讀 | ChatGPT的最強科普

uSMART盈立智投 02-15 20:42

作者:李睿秋Lachel

源:L先生說

 

我想,最近許多朋友的生活中,可能或多或少都被 ChatGPT 刷屏了。

你或許已經看過了許多相關的文章。它們或許從商業角度出發,告訴你 ChatGPT 引發了怎樣的商業浪潮;或許從技術角度出發,告訴你 ChatGPT 的原理和技術有多厲害;又或者,直接向你推銷各種各樣的類似產品,告訴你這些產品多麼有前途……
但這些,離我們的生活都有些遙遠。你可能看了很多文章,依然沒有搞明白,ChatGPT 究竟是什麼,它跟我有什麼關係?
因此,今天,我想簡單聊聊這個話題。
如果你對 ChatGPT 從未聽聞,那希望能告訴你一些新信息;如果你對此感興趣但不熟悉,那希望能爲你提供一點指引。
因爲今天的文章較長,所以做了一個簡單的大綱:
1)ChatGPT 是什麼?
2)ChatGPT 能做什麼?
3)ChatGPT 的缺點和問題
4)ChatGPT 的未來前景
5‍)微調:訓練你自己的人工智能
6)ChatGPT 會替代什麼崗位?
7)結語
ChatGPT 是什麼?
ChatGPT 實際上不是一個新事物。它是2022年11月推出的,剛推出的時候我就使用了,還在知乎發了一條想法吐槽了一下。
沒想到,時隔兩個月之後,隨着微軟及一票商業公司的入場,它又開始火了,火得家喻戶曉。
那麼,ChatGPT 究竟是什麼?
從原理上來講,ChatGPT 其實也不是新事物,它背後的基礎,是母公司 OpenAI 在幾年前發佈的自然語言模型 GPT。對人工智能有所瞭解的朋友一定知道,OpenAI 於 2018 年發佈了 GPT-1,首次讓人工智能能夠讓人類一樣「理解文字」、寫出文字。
隨後幾年裏,OpenAI 陸續推出了 GPT-2、GPT-3,用更龐大的參數實現了更精細的學習。通俗來說,就是讓人工智能更「像人」了。
目前 GPT-3 已經用在了很多場合。像國外已經有用 GPT-3 來寫新聞的應用,至於用 GPT-3 寫小說、生成遊戲臺詞、生成代碼,也都在探索中了。
而 ChatGPT,就是在 GPT-3 的升級版 GPT-3.5 的基礎上,進行一定的包裝、微調、優化,所做出來的產品。過往的 GPT-3 只是一個底層引擎,必須接入到一個軟件中才能使用。而 ChatGPT,可以理解爲 OpenAI 自己爲 GPT 做了這麼一個軟件,讓用戶可以直接使用它。
所以它才叫 ChatGPT,也就是「可以聊天的 GPT」
那麼,GPT 又是什麼呢?它的全稱是 Generative Pre-trained Transformer,生成式預訓練轉換器。簡單來說,它的原理是:先給它提供一個龐大的語料庫(通常是直接從互聯網上抓來的),讓模型通過上千億個參數對這些文本進行打散、標記、學習,構建起一個複雜的預測模型。
然後再依據這個預測模型,判斷一個單詞在這個情境下應該接哪一個單詞。就這樣一個一個單詞串起來,形成一段話,或者一篇文章。
這種預測的模式,其實跟我們大腦的學習和加工模式是非常相似的(詳見《打開心智》第一章)。因此,這也是它能夠更「像人」的一個重要原因。
我們可以用三層模型來理解:
  • 這個模型背後無需人工參與的「無監督」式預訓練自學習原理,或者說讓模型像大腦「自由生長」的過程,就是它的動力層;

  • 藉由這個原理所完成的 GPT-3.5,就是一個結構層,是 ChatGPT 起作用的主要基礎;

  • 而對這個 GPT-3.5 進行包裝、優化所形成的 ChatGPT,就是一個交互層,它的本質就是加了一層更友好的用戶界面和交互方式,讓個人用戶能夠更容易地應用它。

ChatGPT 能做什麼?
瞭解完 ChatGPT 的原理,我們自然會關心一個問題:就目前而言,ChatGPT 究竟能做什麼?
1)回答問題。
這可能是 ChatGPT 最簡單的應用。你在聊天界面裏向它提問,比如「波粒二象性是什麼意思」,它就會用流暢的語言向你解釋,把這個概念講解得非常清楚。就我試用的體驗而言,效果非常好,簡潔曉暢,表達能力勝過許多人。
2)撰寫文章。
你可以向它提要求,讓它按照你的要求撰寫一篇文章。這是我去年做的一個實例,大家可以看看:
質量還是挺像模像樣的。
在這個基礎上,可以有非常多針對性的應用。比如:
你可以讓它撰寫一封郵件,告訴客戶你的報價,並且用禮貌、懇切的語言去表述。它寫出來的作品保證用詞精確,句子流程,比一般人寫的要好;
你可以給它一個主題,再給一些背景和指引,讓它撰寫一份策劃方案,甚至讓它幫你想創意、提供各種不同方向的點子和靈感。這可以幫你節省大量時間精力;
你可以給它一些數據,讓它根據這些材料撰寫一份報告。它會非常智能地組合這些材料,生成一份文質兼美、結構清晰的報告,省去你斟酌文字的大量功夫;
你可以給它一個選題,讓它生成大量內容、風格和行文都截然不同的文章,發佈在各個平臺上。據說已經有一些營銷號開始這麼幹了;
你甚至可以讓它按照老師的要求寫一篇論文。實際上,國外已經有許多學生開始用 ChatGPT 完成作業了,也開始有大學教授跟 ChatGPT 「鬥智鬥勇」,比如要求學生現場寫作,要求學生解釋每段話的意思,等等。
所以有一個笑話是這樣的:
老師對 ChatGPT 說:請幫我想一個題目;學生對 ChatGPT 說:請按照這個題目幫我寫一篇文章;助教對 ChatGPT 說:請幫我給這些文章寫評語並打分。
3)總結提煉。
ChatGPT 還有一個非常強的能力,就是對輸入的材料進行總結提煉。比如:你可以給它輸入一篇文章,讓它概括文章大意;或者給它輸入一段討論,讓它總結主要觀點和論證。
現在也已經出現了一些產品,利用 ChatGPT 背後的 GPT 構建,能夠實現這樣的效果:你輸入一個視頻、一個播客,AI幫你收聽,聽完,用簡潔的語言總結出視頻或播客的要點,呈現給你。
4)生成代碼。
許多程序員朋友盛讚 ChatGPT 的一點,在於它的代碼能力非常強。你提一個要求,比如「如何實現XXXX效果」,ChatGPT 會告訴你幾種可行的方案,並提供這些方案的主要函數和算法;你向它提問,比如「在XXXX情況下出現了一個bug,爲什麼」,ChatGPT 會告訴你幾種可能的原因,並告訴你如何處理每一種可能性。
我自己試了一下,我覺得它寫代碼的能力比我強多了,大概有100倍吧。
之所以 ChatGPT 能夠掀起這麼大的熱潮,一大原因是因爲它太「像人」了。你會感覺,跟你對話的似乎不是一臺機器,而是一個非常聰明,幾乎無所不知、無所不能,並且能滿足你任何要求的人。這一點,令許多人慾罷不能。
這表現在幾個地方:
1)每一次跟 ChatGPT 聊天時,只要你不關閉窗口,你說的每一句話都會成爲它的「上下文」。
換言之,你可以像跟真人對話一樣,不斷問它「然後呢?」「還有嗎?」,或者表達你的態度,它會給出像真人一樣的迴應,無需你不斷重複、補充、完善問題。
舉個例子:你拋出一個話題,它回答,你對它的回答裏有個地方不太滿意,可以直接指出來,它會道歉,然後給出一個更好的、滿足你要求的回答。這個過程非常自然、流暢,你就像在跟一個真人對話,它能完全理解你的每一句話,並給出合乎邏輯的迴應。
2)得益於海量的訓練參數(GPT-3 有 1750 億個參數),ChatGPT 的文字生成能力非常精細,質量極佳。
它寫的文章,表達能力甚至強於許多不擅長寫作的普通人。我有時向它提幾個問題,它給出的回答會讓我感到「有啓發」,或者是一個新的角度,或者是一個完善的框架,這已經非常有價值了。
ChatGPT 的缺點和問題
但是,ChatGPT 也並非絕對完美。實際上,就目前而言,ChatGPT 依然存在好幾個亟待解決的問題。
最嚴重的問題,就是 ChatGPT 的錯誤率實在是太高了。舉一個簡單的例子,這是我去年用 ChatGPT 測出來的實例:
爲了模仿一個外行人,我刻意把問題寫得不太準確,可以看到,答案非常離譜。這可能跟 ChatGPT 的訓練語料庫主要是英文材料有關。用英語提問的話,答案的正確率會提升,但依然會出錯。
並且,ChatGPT 往往會用非常自信、言之鑿鑿的語氣來回答問題。這就導致了,如果你是一個外行人,很多時候你可能壓根沒辦法分辨它給出答案的準確性。哪怕是內行,對於一些較爲瑣碎的細節,也很難去驗證。
去年 ChatGPT 剛發佈時,知名的程序開發交流論壇 Stack Overflow 就很快將其封禁。官方的解釋是:這是因爲 ChatGPT 給出的答案經常有錯誤,但我們很難看出錯誤在哪裏。
從我的角度來說,如果一款人工智能工具,100次回答裏面有3-5次是錯誤的,那我可能就不會用它。因爲我很難判斷它會不會再某一次突然犯一個大錯誤,給我造成嚴重損失。
實際上,我可能希望等它的錯誤率達到千分之一以下時纔會去使用。但就目前來看,可能還需要很長一段時間,才能達到這個水平。
另一個問題是道德倫理問題。
ChatGPT 是一個人工智能程序,它只會忠實地按照內在的預測模型回答問題。因此,如果你向它進行誘導性提問,那可能會得到一些偏離道德倫理的答案。這可能會引起不必要的負面反應。
儘管官方已經在不斷修復漏洞了,但畢竟防不勝防。再者,你修復得越多,也就意味着這個工具能夠發揮作用的場景越少。這可能是一個需要考慮的平衡。
最後一個非常重要的問題,是攝入信息的水準問題。
ChatGPT 不能憑空生成信息,它所有的知識,都只能來自於它被餵養的語料。那麼,顯而易見,它所能夠提供的答案,能夠輸出的內容,也不會超過這些語料的平均水平。你不可能指望它攝入一大堆插科打諢的帖子,要求它寫出《三體》。
而由於互聯網上存在大量的劣質信息,這就導致了:ChatGPT 攝入的信息越多,它整體的水平可能也就越低下。
遺憾的是,我們至今還沒有一套可靠的方法,能夠客觀地判斷內容質量的優劣。高引用的論文也可能是錯的,名氣頗大的學者也可能是灌水出來的,關注者頗多的 KOL 也可能是營銷號。
而如果依賴於用戶的點贊或轉發等數據去判斷內容質量,常識和經驗告訴我們:這樣帶來的勢必是大量譁衆取寵、吸引眼球的劣質內容,只會更嚴重地污染這個池子。
並且,隨着大量工具和服務開始使用 ChatGPT 等工具,大量由人工智能生成的文章會充斥互聯網。這就會造成「自產自銷」。一旦人工智能只能餵養由其他人工智能產出的語料,它的水準就將會遭遇一面難以打破的障壁。
有研究認爲,在5-10年內,互聯網上的內容可能就會被用光。屆時,人工智能將成爲無米之炊,只能再次反芻自己所產出的信息。
這可能會是制約 ChatGPT 等 AIGC(人工智能生產內容,AI Generated Content)工具的一個最嚴重的問題。
ChatGPT 的未來前景
如果我們用樂觀的眼光去看待,認爲 AIGC 能夠克服上述這些問題,那麼,它對我們的生活,會帶來什麼樣的改變呢?
1)搜索。
互聯網發明之前,我們的信息獲取可以說是搜索1.0時代。那時,我們只能到圖書館去查閱資料,用卡片和筆記本做筆記,通過攝影或手抄的方式記錄,繁瑣,麻煩,成本又高。因此,「做研究」成了一件陽春白雪的事情,只有少數人有能力去做。
後來,有了互聯網,有了搜索引擎,大量的信息被電子化,放到網絡上。我們獲取信息的方式被大大拓寬了。只需要輸入關鍵詞,就能看到刊載在各種期刊上面的文獻,存放在圖書館裏面的資料,看到別人的分析、觀點和見解。我們迎來了一個信息爆炸的搜索2.0時代。
而有了 ChatGPT 等 AIGC 工具的輔助,我們可能會迎來搜索3.0的時代。
搜索2.0迫切需要解決的問題是什麼呢?信息太多了。如何有效地篩選、提煉、整合這些信息,就成了一個難題。但 AIGC 可以解決這個問題。我們向它提問,給出一個關鍵詞,它快速整合知識庫裏相關的信息,總結提煉出最符合我需求的答案,呈現給我們。
整個過程流暢,自然,舒適,可以省去我們在大量信息間來回穿梭、整理的時間,極其便捷 —— 這就是搜索3.0。
你問,它答,答案就在那兒,以最好的面貌呈現給你。
現在已經有一些類似這樣的工具了。比如我在用的學術搜索引擎 Elicit,就是使用人工智能檢索我想要的論文,不過還停留在比較初級的階段。也許等有了更成熟 GPT 的加持,會再上升一個臺階。
因此,ChatGPT 也吸引了許多巨頭的關注。目前最受關注的,應該就是微軟和谷歌了。
微軟已經直接投資了 OpenAI,並且計劃在自己的搜索引擎必應和瀏覽器 edge 中嵌入 ChatGPT。目前,ChatGPT 版必應已經在國外向少量媒體開放,個人使用可能還要等一段時間。你可以登錄必應國際版,會有一個加入等待清單的提示。
谷歌也宣佈將一個人工智能 Bard 嵌入 Google 搜索之中。Bard 背後依託的是谷歌自己開發的人工智能模型 LaMDA,跟 GPT 效果相似但不同。
2)閱讀。
前面提到,ChatGPT 有總結提煉的能力。這一點,可能徹底改變我們閱讀和學習知識的方式。
試想一下:未來我們會如何學習一個新概念?你向人工智能提問,它直接把概念詳細講解給你。不懂的地方可以繼續追問,它會進一步向你解釋。那麼,你還需要去到處找資料、看教材、聽課程嗎?不需要了。有人工智能就夠了。
未來我們會如何閱讀一本書?也許你可以把它導入人工智能,它會自己幫你總結提煉出書裏最有價值的內容。可能是作者的觀點,可能是方法論和步驟,可能是案例或論據……你想要什麼,就向它下達什麼指令,讓它幫你「脫水」,呈上一份完善的摘要。
未來我們會如何看視頻、聽播客?或許我們也不用看、不用聽了,直接導入人工智能,它會幫我們總結出其中的要點,甚至可以幫我們寫一份妙趣橫生、文採飛揚的閱讀報告,讓我們能輕鬆愉快地攝入知識。
未來,我們可能每個人都有擁有屬於自己的專屬醫生、律師、財務經理……無論我們想要諮詢什麼問題,直接問人工智能就好,它會給出最新、最全面、最準確的答案。
當然,上面說的這些,現在的人工智能還遠遠不能做到。但很可能我們離這一天也不會多遙遠了。
3)寫作。
這一點可能是更簡單的了。
我們不再需要自己字斟句酌去寫郵件,只需要給它一個指令,人工智能就會自動幫我們寫好一份郵件。
我們不再需要自己寫材料、寫報告,只需要給它足夠的信息,人工智能就會自動幫我們整理好文字,並且文筆上乘。
我們不再需要把大量的精力耗費在撰寫方案、文檔上面,而只需要思考,想出各種各樣的創意、主題、想法……再把這些想法告訴人工智能,它就可以自動幫我們把這些繁瑣的事務全都搞定。
甚至,連思考本身都可以讓人工智能來輔助 —— 你可以給它一個話題,讓它幫你尋找素材、案例、參考資料;或者讓它幫你頭腦風暴,提供各種各樣的點子供你參考……
我們或許將真正迎來一個「人工智能助理」時代。
微調:訓練你自己的人工智能
在這些應用之中,最令我感興趣的,其實是微調(fine-tuning)。
什麼意思呢?它指的是:在人工智能本身的基礎上,你再餵給它一些獨特的、專屬於你自己的材料,把它訓練成一個屬於你自己的人工智能,讓它能夠回答一些更具針對性的問題,滿足你獨特的需求。
舉幾個例子。
國外有人分享了一個實例:她把自己童年時的日記上傳到一個人工智能模型中,讓程序去學習她的思維、經歷和文字,從而製造出了一個「童年的自己」。然後,跟這個「童年的自己」交談。把自己遇到的問題,產生的困惑,面臨的抉擇向她詢問,從自己的內心中尋找答案。
這是一個非常有意思的例子,也令我非常難忘。
同樣,如果把一位作家的所有作品輸入進去,或許再加上他的生平和經歷,這個人工智能就能用作家的口吻去回答一些相關問題。國外有人做了這麼一個嘗試,向 ChatGPT 輸入《反脆弱》作者塔勒布的作品,讓它煞有介事地回答問題,使得塔勒布本人不得不出來糾正。
那麼,如果把《紅樓夢》以及明清的各種史料餵給一個更成熟的人工智能,它有沒有可能續寫出《紅樓夢》?我想,這是可能的。
我感興趣的點在於:通過微調,我們完全可能創造出一個專屬於我們自己的人工智能 —— 只需要把我們所有的筆記,工作中產生的材料,平時的思考和日記……都餵給它,就可以了。
在這個情況下,它就是你,甚至它比你自己還更接近你自己 —— 因爲許許多多你可能已經忘卻了的記憶,它都能夠忠實地保留着,並依據一套算法完善自己的預測模型,做出更符合你內心和需求的選擇。
換言之,這就是一個專屬於我們的「內腦」。當我們有疑惑時,當我們需要搜尋信息時,當我們需要分析問題、做出判斷時,都可以參考它的意見。
不過,目前的 ChatGPT 似乎還不提供微調的功能,但 OpenAI 官網是有幾個模型提供微調的,只不過需要一定的技術能力。感興趣的朋友可以試一試。
另外,現在有些工具也在往這個方向嘗試。比如有一些新興工具,嘗試記錄你在電腦上瀏覽過的一切信息;以及知名筆記軟件 Notion 也推出了 Notion AI,能夠提供類似 ChatGPT 的功能。
那麼,如果在我們的電腦中內置一個人工智能助手,或者在筆記軟件中內置一個人工智能,把我們攝入和記錄的信息都作爲語料餵給它,似乎並不是遙不可及的事情。
到時也許可以出現這樣的事情:你閒來無事,向它提問:最近有沒有什麼適合我看的電影?它會向你推薦一個清單。上面的內容來自哪裏呢?來自它對你打過分的電影、讀過的小說、有感而發的想法、平時搜索的內容、甚至跟朋友聊天的信息……這些數據進行綜合分析之後,所推斷出的你的喜好。
它甚至會告訴你:這部電影用到了你三年前偶然想到的一個點子,處理得非常好,有沒有興趣看一下?這部電影探討了一個議題,正好是你前段時間一直感興趣的,不妨參考一下……
當然,這個「內腦」無法繞開的,就是隱私安全的問題。如何確保我們的隱私不被別人所獲得?我們願意付出多少隱私作爲代價來換取這樣一個內腦?我們又能否接受它的存在,如何理解它與我之間的同一性?
這些,也許都是可以探討的問題。
ChatGPT 會替代什麼職業?
似乎每次聊到人工智能,都有人會問這個問題。
不過,我的答案依然是比較樂觀的。就目前來看,甚至就上文所述的近未來來看,ChatGPT 等 AIGC 工具,什麼都不會替代 —— 它只會提升我們的效率。
原因很簡單:AIGC 的定位不是一項「職能」,而是一種「工具」。
什麼叫職能?比如有一款人工智能,功能是幫助你看X光片,那這是一項職能,它可能會替代掉一部分醫生的功能;但 AIGC 的功能是搜索、閱讀、寫作,這是所有職業都需要的基礎技能。它本質上是輔助性的,是一種輔助的工具。
AIGC 可以幫我們做到的是什麼呢?我們不需要再給每個 NPC 寫一堆重複的臺詞了,而是可以設計 NPC 的背景,讓 AIGC 自動生成他們的臺詞,甚至產生任務和劇情;我們也不再需要給小說中的每個人物設定人設了,可以先做好背景框架,再讓 AIGC 生成一大堆人物,我們從中挑選,潤色一下就好……
因此,有了 AIGC 的存在,我們能夠想象的未來是:搜索信息更準確了,閱讀效率更高了,得到的專業建議有了更多的渠道可以參考對比,遊戲的劇情和任務可以更豐富了,小說和影視劇可以更多元化了,新聞可以更加實時地推送給我們……
所有的創作型職業都應該爲此感到開心,因爲困擾着他們的最大障礙 —— 無聊的、繁瑣的、勞動密集型的操作性工作,可以被 AIGC 替代掉了。
那麼,面對 ChatGPT 等 AIGC 工具,最需要、可能也是最重要的一項能力是什麼呢?—— 是明確自己想要什麼,並且能夠表達清楚自己想法的能力。
能夠提出一個好問題,有時候比能夠解決一個問題更重要。ChatGPT 的出現,更加清楚地表明瞭這一點。
你對自己的清晰認知,對外部世界的獨特見解,深入事物本質的洞察力,以及將其表達出來的溝通能力。
這四點,會是我們在面對一個由人工智能驅動的世界時,更加瀟灑自如的武器。
最後,用我之前寫的一個想法來作結吧。
隨着 ChatGPT 等 AI 工具的發展,我們還需要記筆記嗎?未來我們該如何管理知識?
所有知識,大體上可以分成三類:
一是客觀存在的信息和事實;
二是我們對這些客觀信息的理解、總結和思考;
三是我們行動實踐所獲得的經驗和心得。
ChatGPT 等 AI 工具,能夠替代的是絕大部分的一,以及一部分二。也就是它能替代客觀信息庫,以及我們對客觀信息的總結。但二裏面我們自己的思考加工, 以及三裏面我們的實踐記錄,是沒有辦法被替代的。
實際上,這也是讓每個人的知識體系和知識結構真正有別於其他人的地方:重要的不是你收集和掌握到了多少信息,而是你對這些信息有着怎樣的理解、形成了哪些自己的看法。
隨着 AI 的發展,未來更好的形態,可能是一個「公用的外腦+私人的內腦」。我們可以接入這個公用的外腦,詢問客觀知識庫所存在的一切信息和資料,包括論文、互聯網文章、書籍、視頻,等等。
而每個人基於他所記錄的思考和項目實踐,可以有一個經過自己微調和訓練的內腦,讓它學習自己的生活和思考方式,通過向它提問獲得更加私人的、針對自己需求的答案,成爲自己的祕書。
到時所謂的「記筆記」,可能就會變成向這個內腦喂材料和微調的過程。而每個人的大腦+內腦,可能就會變成一個專屬於他的思考機器,也是將每個人區分開來的方式。
我非常期待這一天的到來。
閒聊時刻
那麼,如何體驗 ChatGPT 呢?
使用 ChatGPT 需要註冊 OpenAI 的賬號。遺憾的是,註冊賬號有一定的門檻。目前,OpenAI 不接受中國大陸的 IP 訪問,也不接受中國大陸的手機接收驗證碼。如果你有海外朋友,可以請求他們的幫忙。
然後,ChatGPT 現在需要付費了,每月的價格是20美元。免費賬戶也能用,但是會有限制,經常遇到網絡堵塞。也許過段時間熱度下去了會好一些。
最後,也許是這幾天熱度太高了,ChatGPT 的官網經常出問題,經常訪問不了。因此,不妨多等幾天,不用急着去嘗試。
另外,前文也講過,微軟的必應和谷歌都在嘗試將類似產品嵌入到搜索引擎之中,等正式上線了也可以體驗一下。
同樣,國內應該很快也會有類似產品出現,或者直接接入 OpenAI 的 API。大家可以留意一下。