曰曰碰天天碰国产 视频_日韩精品一区二区三区肥美人作爱_亚洲国产天堂久久综合_精品国产AⅤ麻豆99AV国产精品欲_男人的天堂a视频区在线观看

當(dāng)前位置: 首頁(yè) > 專題 > 正文

謝邀,這是知乎中文大模型給你的答案 世界資訊

2023-04-18 22:31:47鈦媒體APP

在中文問(wèn)答語(yǔ)料最為豐富的社區(qū)知乎,有一個(gè)越來(lái)越重要的角色,它有一點(diǎn)那么不請(qǐng)自來(lái),但是確實(shí)在意料之中。


(相關(guān)資料圖)

這個(gè)角色就是AI。

在日前舉辦的“2023知乎發(fā)現(xiàn)大會(huì)”現(xiàn)場(chǎng),知乎創(chuàng)始人、董事長(zhǎng)兼CEO周源與知乎合伙人、CTO李大海,共同宣布了知乎與面壁智能在AI大模型上的最新合作與應(yīng)用,正式發(fā)布了“知海圖AI”中文大模型。

這是知乎首個(gè)大語(yǔ)言模型,應(yīng)用至知乎熱榜。它以“熱榜摘要”的形式呈現(xiàn),利用其語(yǔ)言理解能力,對(duì)知乎熱榜上的問(wèn)題回答進(jìn)行抓取、整理和聚合,并把回答梗概展現(xiàn)給用戶,給大家直觀清晰的回答,目前已經(jīng)開(kāi)啟內(nèi)測(cè)。

面壁智能聯(lián)合創(chuàng)始人、CTO曾國(guó)洋在大會(huì)演講中表示,經(jīng)過(guò)測(cè)試,在知乎熱榜的應(yīng)用場(chǎng)景下,知乎與面壁合作自研的大模型與GPT-4相比,達(dá)到了持平的效果。未來(lái),“知海圖AI”的能力還將逐步應(yīng)用在對(duì)創(chuàng)作的賦能、對(duì)討論場(chǎng)的賦能和對(duì)信息獲取的賦能。

面壁智能聯(lián)合創(chuàng)始人、CTO曾國(guó)洋

知乎為何要做大模型?

ChatGPT一夜之間全球爆火,讓AIGC成為一種潮流,圍繞著人工智能的話題,再度成為大眾的討論的焦點(diǎn)。

從移動(dòng)互聯(lián)網(wǎng)時(shí)代行至 AI 時(shí)代,知乎以問(wèn)答形式為主,搭建了一個(gè)專業(yè)、多元、有價(jià)值的“討論場(chǎng)”。

之所以決心下場(chǎng)參與大模型領(lǐng)域,周源告訴鈦媒體APP,公司在做業(yè)務(wù)時(shí),首先應(yīng)該思考自己的價(jià)值,能夠給用戶提供的價(jià)值,以及自己的定位是什么,在這個(gè)基礎(chǔ)上,再與商業(yè)社會(huì)產(chǎn)生一個(gè)交集。

知乎本身是一個(gè)場(chǎng)景,場(chǎng)景代表的是用戶需求。在周源看來(lái),知乎最核心場(chǎng)景是“討論”:用戶通過(guò)“討論”的方式,去交換信息,分享知識(shí)、經(jīng)驗(yàn)和見(jiàn)解。

討論也會(huì)形成一些目前用戶熟悉的功能。比如說(shuō),內(nèi)容熱度由討論而產(chǎn)生,最后聚集在某個(gè)地方,又有更多的用戶看到它。這其中,AI可以自動(dòng)生成“熱榜摘要”的場(chǎng)景和功能,以提升用戶體驗(yàn)。

事實(shí)上,早在十年前,知乎有一個(gè)產(chǎn)品功能是“回答總結(jié)”,類似于現(xiàn)在與面壁智能合作的“熱榜摘要”。當(dāng)時(shí),知乎將此項(xiàng)功能開(kāi)放給了所有用戶,用戶可以像維基百科那樣編輯,把大家所有的回答做一個(gè)總結(jié)。

但后來(lái),周源發(fā)現(xiàn),這個(gè)事情太困難了。因?yàn)榛卮饠?shù)量多了以后,人工編輯的成本非常高,而且實(shí)現(xiàn)的效果并不好?,F(xiàn)在,有了AI的方式,當(dāng)用戶想要加入一個(gè)討論時(shí),可以通過(guò)“熱榜摘要”迅速地了解某個(gè)事件的梗概,然后,再去閱讀所有的討論中,他認(rèn)為相對(duì)有價(jià)值的內(nèi)容。

找到自己想要的解答,這就意味著,可以收獲到知乎所倡導(dǎo)的“獲得感”,因?yàn)楂@得感也是因人而異的。

周源認(rèn)為,在一個(gè)技術(shù)快速迭代的時(shí)代,反而更應(yīng)該關(guān)注人,關(guān)注那些獨(dú)特的個(gè)體,關(guān)注他們是否會(huì)因此而受益。

人才儲(chǔ)備是入局大模型另一個(gè)重要的入場(chǎng)券。李大海對(duì)鈦媒體APP說(shuō),大模型本身不是橫空出世,忽然蹦出來(lái)的,而是在這之前,有非常多技術(shù)累積,這個(gè)過(guò)程并沒(méi)有那么突兀。所以,知乎的工程師也可以迅速地去學(xué)習(xí)、消化、吸收,變成大模型領(lǐng)域的開(kāi)發(fā)者、從業(yè)者。

知乎合伙人、CTO李大海

李大海認(rèn)為,在這方面,人類工程師都是非常聰明的。事實(shí)證明,知乎與面壁智能只花了一個(gè)多月的時(shí)間,就做出了非常多肉眼可見(jiàn)、很可喜的進(jìn)展。也可以說(shuō),知乎在大模型上的人才儲(chǔ)備是足夠的。

知乎已經(jīng)有了一個(gè)完整的算法中臺(tái)來(lái)支撐整個(gè)公司的業(yè)務(wù),知乎也早已經(jīng)成為了一個(gè)技術(shù)驅(qū)動(dòng)型的公司。并且,他們很早就提出了“智能社區(qū)”的概念,將AI應(yīng)用在了社區(qū)內(nèi)容的生產(chǎn)、流通、消費(fèi)和治理等環(huán)節(jié)。

邀請(qǐng)AI加入“討論場(chǎng)”,在周源看來(lái),AI時(shí)代的生產(chǎn)力要素,可以從上至下分為三層:應(yīng)用場(chǎng)景、專有數(shù)據(jù)、基礎(chǔ)模型。

在基礎(chǔ)模型層,以GPT為代表的大模型迭代速度非常快,性能不斷地提升,同時(shí),其成本也在不斷下降。今天中國(guó)的AI生態(tài)才剛剛起步,對(duì)于中國(guó)的公司來(lái)說(shuō),可以先在應(yīng)用層和數(shù)據(jù)層兩方面夯實(shí)獨(dú)特的優(yōu)勢(shì),同時(shí),也要在基礎(chǔ)模型層去成為新生產(chǎn)力的開(kāi)發(fā)者。

知乎基于問(wèn)答的討論場(chǎng)是天然的應(yīng)用層場(chǎng)景,并且每天都有不斷新增的優(yōu)質(zhì)內(nèi)容,用戶和用戶之間,用戶和內(nèi)容之間進(jìn)行的互動(dòng),構(gòu)成了獨(dú)一無(wú)二的專有數(shù)據(jù)。

“知海圖AI”怎么煉成的?

以Chat-GPT為代表的大語(yǔ)言模型給世界帶來(lái)了驚喜,但落地至中文互聯(lián)網(wǎng),大家發(fā)現(xiàn),主流的大模型英文語(yǔ)言能力往往比中文語(yǔ)言能力更好、更快。

李大海對(duì)鈦媒體APP表示,這其中主要有兩個(gè)原因:第一,中文確實(shí)比英文要更復(fù)雜;第二,開(kāi)放的英文語(yǔ)料相對(duì)于開(kāi)放的中文語(yǔ)料來(lái)說(shuō)質(zhì)量更高,內(nèi)容也更多。這也就意味著,開(kāi)放的英文語(yǔ)料里面蘊(yùn)含的知識(shí)更多,更容易被大模型學(xué)到。

這兩個(gè)技術(shù)問(wèn)題是客觀存在的。中文的問(wèn)題,中國(guó)的科技公司應(yīng)該更有能力去解決。知乎擁有整個(gè)中文互聯(lián)網(wǎng)最優(yōu)質(zhì)的討論和回答。

數(shù)據(jù)顯示,2022年第四季度月平均訂閱會(huì)員數(shù)達(dá)到1300萬(wàn),同比增長(zhǎng)112.5%,2022年的平均MAU(月活用戶)達(dá)到1.01億。成立十年以來(lái),知乎已經(jīng)積累了超過(guò)4400萬(wàn)個(gè)問(wèn)題和2.4億個(gè)回答。

之所以選擇與面壁智能合作,李大海坦言,除了公司開(kāi)發(fā)模型強(qiáng)大之外,也看中了其背后,清華大學(xué)計(jì)算機(jī)自然語(yǔ)言處理和社會(huì)人文計(jì)算實(shí)驗(yàn)室在中文大語(yǔ)言模型領(lǐng)域有很深的積累。

從2020年開(kāi)始,面壁智能就發(fā)布了全中文互聯(lián)網(wǎng)首個(gè)中文大語(yǔ)言模型CPM-1,在后續(xù)的三年,又陸續(xù)發(fā)布了CPM-2,CPM-3和CPM-Ant等多個(gè)開(kāi)源的模型,這些模型都可以在網(wǎng)上免費(fèi)獲得。

它們最新的大語(yǔ)言模型CPM-Bee,是李大海他們發(fā)現(xiàn)的最好的中文大語(yǔ)言模型之一。知乎還投資了面壁智能,很快,雙方團(tuán)隊(duì)展開(kāi)了大語(yǔ)言模型的深度共建的過(guò)程。

在研發(fā)業(yè)務(wù)中,雙方團(tuán)隊(duì)利用了CPM大模型強(qiáng)大的內(nèi)容理解能力,對(duì)知乎熱榜問(wèn)題中所有的回答進(jìn)行要素抽取、觀點(diǎn)梳理和內(nèi)容聚合,最終在問(wèn)題頁(yè)面下,將知友們的所有回答的梗概呈現(xiàn)給用戶,讓大家能更快、更全面地了解熱門討論的熱點(diǎn)與焦點(diǎn),更好的參與到討論中來(lái)。

不過(guò),在開(kāi)展工作的過(guò)程中,團(tuán)隊(duì)也面臨一些困難。比如說(shuō),作為一個(gè)非常開(kāi)放的社區(qū),知乎用戶的創(chuàng)造力、表達(dá)力很強(qiáng),很多有趣的、專業(yè)的回答,即便是知乎資深的運(yùn)營(yíng)人員,也要花很長(zhǎng)時(shí)間才能準(zhǔn)確無(wú)誤地梳理出核心觀點(diǎn)。

而在調(diào)教大模型的過(guò)程中,在熱榜問(wèn)題下,需要把所有知友的回答觀點(diǎn)抽取聚合。在這個(gè)具體場(chǎng)景里會(huì)涉及到難點(diǎn)是,一方面,對(duì)和問(wèn)題相關(guān)的知友觀點(diǎn)的抽取是否準(zhǔn)確,另一方面,這些觀點(diǎn)抽取以后聚合是否合適。而且,在知乎的答主的產(chǎn)出的內(nèi)容千奇百怪,甚至有時(shí)候會(huì)有其他的觀點(diǎn)呈現(xiàn),而這個(gè)觀點(diǎn)跟提問(wèn)沒(méi)有關(guān)系。

這些因素都訓(xùn)練整個(gè)大模型產(chǎn)生了很大的挑戰(zhàn)。曾國(guó)洋對(duì)鈦媒體APP說(shuō),團(tuán)隊(duì)做了很多的工作,花了不少的時(shí)間來(lái)調(diào)教大模型,讓它在算法工程師的陪伴下,閱讀了大量知乎中的優(yōu)秀回答,最終才取得了不錯(cuò)的成果。

最近一個(gè)令他們欣喜的成績(jī)是,在知乎特定的場(chǎng)景內(nèi),開(kāi)發(fā)者選取了41個(gè)熱門的話題,將“知海圖AI”與OpenAI最新的GPT-4進(jìn)行了一個(gè)橫向?qū)Ρ?,結(jié)果發(fā)現(xiàn),目前知乎的大模型已經(jīng)達(dá)到了和GPT-4持平的效果。

以AI輔助創(chuàng)作

在AIGC蓬勃發(fā)展的趨勢(shì)之下,一個(gè)值得思考的問(wèn)題在于,作為一個(gè)以人的問(wèn)答交互為核心的社區(qū),知乎在引入AI之后,是否會(huì)對(duì)原來(lái)的真人創(chuàng)作內(nèi)容以及創(chuàng)作者形成沖擊?而此前知乎上“抖機(jī)靈”式特色回答又是否會(huì)消失?

針對(duì)這一議題,周源對(duì)鈦媒體APP表示,社區(qū)一定是人為本,知乎本質(zhì)是人與人之間的討論和分享,它的起點(diǎn)是人,它的終點(diǎn)也是人。但是AI不是人,而是一個(gè)環(huán)節(jié),AI服務(wù)的對(duì)象主體是人,人是知乎社區(qū)里面的每一份子。

AI可以幫助社區(qū)中的創(chuàng)作者,提升他們的創(chuàng)造力,提升效率和質(zhì)量,從而能夠讓更多的社區(qū)用戶能夠獲得幫助,開(kāi)闊眼界,產(chǎn)生共鳴,而這恰恰也是知乎提倡的“獲得感”的內(nèi)容價(jià)值觀。

這是知乎一個(gè)非常重要的原則,他們也正按照這樣的方式,在考慮產(chǎn)品迭代優(yōu)化上,始終考慮最后的價(jià)值點(diǎn)落在哪里。只要清楚地堅(jiān)持這個(gè)原因,AI創(chuàng)作與人類創(chuàng)作,并不會(huì)產(chǎn)生真正的沖突。

在周源看來(lái),雖然不是所有人都有需求去寫一篇圖文并茂的文章,但有這個(gè)需求的人,一定會(huì)希望以更高效的方式,去產(chǎn)生出更好的內(nèi)容。某種意義上來(lái)說(shuō),知乎的專業(yè)用戶聚集度較高,他們會(huì)研究怎么用AI生成的圖片,或者用大模型生成一段文字。

所以,知乎在今年初還上線了AI輔助創(chuàng)作的功能,其核心是想表達(dá),用這樣的工具創(chuàng)作,是沒(méi)有問(wèn)題的,因?yàn)檫@是一個(gè)大趨勢(shì)。

在此次大會(huì)發(fā)布的“海鹽計(jì)劃5.0”中,知乎錨定職人創(chuàng)作者群體提升權(quán)重,最高可獲得5倍流量及漲粉加權(quán),并配合多渠道助力職人創(chuàng)作者變現(xiàn)。

作為有專業(yè)的教育背景以及專業(yè)的職業(yè)身份,精通某項(xiàng)領(lǐng)域某種技能的群體,目前我國(guó)潛在的職人群體超過(guò)3億,這些職人群體與知乎的用戶群體高度吻合,他們很多都是活躍在一二線城市的職業(yè)工作者,在工作領(lǐng)域和興趣愛(ài)好方面有著豐富的經(jīng)驗(yàn)。

周源相信,每個(gè)人都有專業(yè)的一面。因?yàn)榉浅?jiān)定定位,才能明確地把價(jià)值做深。從去年增長(zhǎng)快速的會(huì)員業(yè)務(wù)(會(huì)員其實(shí)是從社區(qū)平臺(tái)上再長(zhǎng)出來(lái)比較深入的業(yè)務(wù)),以及圍繞職業(yè)人群“職人”開(kāi)展的職業(yè)教育業(yè)務(wù),都是圍繞社區(qū)把內(nèi)容鏈做得更深、做得更堅(jiān)實(shí)的過(guò)程。

社區(qū)以人為先,這是知乎在12年前出發(fā)點(diǎn),現(xiàn)在,知乎有機(jī)會(huì)在技術(shù)助力之下,把這件事情做得更好。從去年開(kāi)始,知乎開(kāi)始深耕“生態(tài)第一”戰(zhàn)略后,社區(qū)的數(shù)據(jù)增長(zhǎng),包括用戶的留存、市場(chǎng)拓展,創(chuàng)作者數(shù)量和品類,這都來(lái)自于知乎非常清楚地堅(jiān)守了自己的定位:專業(yè)討論。

至于AI會(huì)如何識(shí)別文本是一本正經(jīng)的專業(yè)討論,還是屬于抖機(jī)靈式回答,曾國(guó)洋對(duì)鈦媒體APP說(shuō),“大家不要太小看大模型的能力。人能知道它在抖機(jī)靈,大模型也知道?!?/p>

關(guān)鍵詞:

1個(gè)月內(nèi)實(shí)現(xiàn)受檢率100% | 重慶市南岸區(qū)市場(chǎng)監(jiān)管局開(kāi)展“免費(fèi)檢定、服務(wù)上門”行動(dòng)|世界時(shí)訊

中國(guó)質(zhì)量新聞網(wǎng)訊(謝旺江)基層醫(yī)療機(jī)構(gòu)醫(yī)用計(jì)量設(shè)備檢定緊密聯(lián)系民生、關(guān)乎群眾生命安全,是民生計(jì)量工作的重要組成部分。為保障基層醫(yī)療衛(wèi)
2023-04-18
快訊
“非物質(zhì)文化遺產(chǎn)進(jìn)校園活動(dòng)”展演活動(dòng)在鳳翔學(xué)校順利開(kāi)展
信陽(yáng)市市文廣旅局舉辦非物質(zhì)文化遺產(chǎn)申報(bào)放權(quán)賦能培訓(xùn)會(huì)召開(kāi)
淮南市第五批市級(jí)非物質(zhì)文化遺產(chǎn)代表性項(xiàng)目公布
”陜西省非物質(zhì)文化遺產(chǎn)研究基地“在榆林成立
定了!在鄭州舉辦的2022中國(guó)非遺年會(huì)延期舉辦
喜訊!甘肅省古籍保護(hù)中心“古籍修復(fù)技藝”被列為省級(jí)非遺
從“非遺進(jìn)校園”到“非遺在校園”!廣東發(fā)布20個(gè)優(yōu)秀案例
動(dòng)態(tài)
2022-08-29上半年河北海洋生產(chǎn)總值1280億元 海洋傳統(tǒng)產(chǎn)業(yè)穩(wěn)步恢復(fù)
2022-03-18江蘇鹽城:東臺(tái)西溪天仙緣景區(qū)打造文旅融合新天地
2022-03-18數(shù)字化時(shí)代 用數(shù)字化讓文化遺產(chǎn)火起來(lái)
2022-02-16一圖讀懂新一輪“雙一流”建設(shè)