ChatGPT橫空出世以來,“生成式人工智能未來會取代哪些工作”已經(jīng)成了熱議的關(guān)鍵社會議題。
高盛近期通過對900余個職業(yè)工種取樣分析并撰寫報告估算,美國約有三分之二的職業(yè)或在某種程度上受到生成式AI的影響。但報告同時指出,1940年至今約八十年期間,85%以上的就業(yè)增長來自于技術(shù)創(chuàng)新而產(chǎn)生的新職位。在醫(yī)療健康、智能制造等創(chuàng)新經(jīng)濟領(lǐng)域,人工智能將輔助人類,而非取代。
西湖心辰團隊從2020年研發(fā)生成式大模型開始,就將“人工智能否成為心理咨詢師”作為目標(biāo)。西湖心辰最早從西湖大學(xué)工學(xué)院的深度學(xué)習(xí)實驗室孵化而來,公司在2021年7月正式注冊成立,同年12月拿到了之一筆近千萬美元的天使輪融資,由藍(lán)馳創(chuàng)投領(lǐng)投,主要研究“人工智能自然語言處理+心理咨詢服務(wù)“的產(chǎn)品應(yīng)用。
ChatGPT爆火帶動了國產(chǎn)大模型的創(chuàng)業(yè)潮,西湖心辰分別在今年3月、4月接連完成了兩筆融資。Pre-A輪獲得了百度風(fēng)投領(lǐng)投的數(shù)百萬美元,最新的戰(zhàn)略投資則引入了AIGC概念股公司湯姆貓(300459.SZ)成為更大的外部股東。
西湖大學(xué)的深度學(xué)習(xí)實驗室正是由西湖心辰創(chuàng)始人藍(lán)振忠組建。在谷歌研究院 (Google Research) 任職期間,他作為論文之一作者發(fā)布了谷歌BERT語言模型的輕量版本“ALBERT“(A Lite BERT )——與BERT的3億參數(shù)相比,ALBERT用更少的參數(shù)實現(xiàn)了更好的表現(xiàn)——從2019年12月發(fā)表至今,該篇論文在Google Scholar平臺上引用已經(jīng)超過4600次。
與先前的技術(shù)路徑相比,OpenAI的成功使得“越卷越多”的參數(shù)規(guī)模成為各家大模型競逐的對象,動輒千億級、萬億級的大參數(shù)變成標(biāo)配。“擴大參數(shù)量目前是一個快速把模型變得更加智能、至今還沒有探到底的好辦法。它就像蓋摩天大樓一樣,蓋一層后就知道如何蓋兩層、三層,最后把摩天大樓蓋好。”藍(lán)振忠接受界面新聞專訪時表示,公司自研模型經(jīng)過多輪迭代的參數(shù)量變化很大,小到60億,大到1000億,目前主要在用的是100多億參數(shù)的模型。
2020年,藍(lán)振忠回國作為特聘研究員 *** 加入西湖大學(xué),擔(dān)任博士生導(dǎo)師并著手組建深度學(xué)習(xí)實驗室,起步階段就把研究方向錨定在AI輔助心理咨詢。他曾經(jīng)在”TEDxChengdu“論壇上提到選擇心理健康領(lǐng)域的初衷,與自己的一位同學(xué)在讀博期間自殺有關(guān)。“心理咨詢是目前比較好的防自殺方案,但一個重要問題是專業(yè)人才缺口巨大。按照世界衛(wèi)生組織的建議,每1000人需要有一位心理咨詢師。但是現(xiàn)在(2021年)全國也只有35萬左右的從業(yè)者,中間差不多有140萬的需求差距。”
根據(jù)世界衛(wèi)生組織在2022年最新發(fā)布的《世界精神衛(wèi)生報告:向所有人享有精神衛(wèi)生服務(wù)轉(zhuǎn)型》統(tǒng)計,大約一半的世界人口所在國家每20萬或以上才有一名精神科醫(yī)生。另一方面,新冠疫情大流行期間,焦慮癥和抑郁癥的發(fā)病率僅在之一年已經(jīng)增加了25%。世衛(wèi)組織認(rèn)為,后疫情時代想要實現(xiàn)人人可享的精神健康服務(wù),人工智能代表的數(shù)字化技術(shù)就成為了彌補治療缺口的關(guān)鍵。
要教會自研的對話機器人“小天”學(xué)習(xí)心理咨詢,西湖心辰團隊先是找來了一批專業(yè)的人類心理咨詢師,如同工程師訓(xùn)練語音助手一樣,通過一條條拆解心理咨詢的常見話術(shù)來讓機器理解語言規(guī)律。但因為現(xiàn)實咨詢的問題無限多但掌握有限,無法做到一一匹配。
團隊嘗試幾個月沒有成功后開始轉(zhuǎn)換思路,不要求機器完全理解人類語言,只要求它去模仿咨詢師。
模仿需要數(shù)據(jù),訓(xùn)練數(shù)據(jù)的不同很大程度上決定了大模型的差異。團隊為獲取具有情感特征的語料,創(chuàng)建了一個名叫“心聆公益”的咨詢平臺,既做服務(wù)平臺又做數(shù)據(jù)庫,用戶來做心理咨詢的同時也在訓(xùn)練“小天”。
藍(lán)振忠告訴記者,團隊一開始在開發(fā)訓(xùn)練“小天“背后的語言模型時并不追求大而全,“因為ChatGPT及背后的GPT3.5模型定位在通用對話上,決定了它預(yù)訓(xùn)練的數(shù)據(jù)源主要偏向綜合、中性。它就像是一個大型的Q&A系統(tǒng),實際和用戶對話中缺乏溫度,大部分都是沒有情感的說教。”
對標(biāo)OpenAI,藍(lán)振忠表示,如果按照GLUE、SQuaD、 RACE這樣的公開測試數(shù)據(jù)集的量化標(biāo)準(zhǔn)去評價模型的綜合表現(xiàn),目前國產(chǎn)大模型絕大多數(shù)都還在追趕GPT3.5。定位在“情感”上的差異化是團隊一直在做的事情,在緊鑼密鼓融資的兩個月,團隊的工作重心仍是在改進(jìn)情感大模型的對話質(zhì)量與安全性。
大模型的爆火也給創(chuàng)業(yè)公司帶來了更多商業(yè)化的思考。藍(lán)振忠坦承目前心理咨詢收費模式還很難走通。“小天”最初做的是公益咨詢,為線上來訪者提供免費的對話咨詢服務(wù),早期用戶也為訓(xùn)練大模型貢獻(xiàn)了重要的數(shù)據(jù)資源。西湖心辰目前通過AI作畫工具“造夢日記”、AI寫作工具“Friday”面向C端用戶,還開放了API接口服務(wù)面向B端用戶。這三款全部為收費產(chǎn)品,至今已經(jīng)積累了數(shù)百萬用戶。
商業(yè)化的思考同時也反映在藍(lán)振忠的身份轉(zhuǎn)變上。他在2月份發(fā)的一條朋友圈里表示西湖心辰正在尋找CEO,現(xiàn)在已經(jīng)以創(chuàng)始人的身份兼任CEO。藍(lán)振忠認(rèn)為,大模型的壁壘在于數(shù)據(jù)、工程復(fù)雜度和人才密度。“對外 *** CEO是考慮到自己長期都是在做科學(xué)家不適合管理。大模型的競爭已經(jīng)趨近白熱化,當(dāng)時思考更多的是組建更強隊伍來讓公司跑得更快,眼下也正在主動適應(yīng)新身份并學(xué)習(xí)摸索。”