日韩在线视频导航,av毛片免费看,黄www色,天天操天天噜,紧缚解禁完全紧缚されて,紧缚解禁完全紧缚されて,国产精品久久久久一区二区三区

當(dāng)前位置：首頁(yè) > 24小時(shí)熱點(diǎn) > 正文

中信證券：OpenAI發(fā)布草莓模型o1 通用推理能力顯著提升

【新澳门内部资料精准大全】

【2024澳门天天开好彩大全】

【管家婆一肖-一码-一中一特】

【澳门一肖一码必中一肖一码】

【2024澳门正版资料免费大全】

【澳门一肖一码100准免费资料】

【2024澳门特马今晚开奖】

【2024正版资料大全免费】

【2024澳门天天六开彩免费资料】

【澳门今晚必中一肖一码准确9995】

【澳门资料大全正版资料2024年免费】

【澳门2024正版资料免费公开】

【澳门天天开彩好正版挂牌】

【2024澳门天天六开彩免费资料】

【澳门一码一肖一特一中2024】

【澳门管家婆一肖一码100精准】

【澳门王中王100%的资料】

【今期澳门三肖三码开一码】

【2024澳门天天开好彩大全】

【2024一肖一码100精准大全】

【494949澳门今晚开什么】

【香港二四六开奖免费资料】

【澳门平特一肖100%免费】

【7777888888管家婆中特】

【2024澳门天天六开彩免费资料】

【2024澳彩管家婆资料传真】

【管家婆精准一肖一码100%l?】

智通財(cái)經(jīng)APP獲悉，中信證券發(fā)布研報(bào)稱，北京時(shí)間9月13日凌晨，OpenAI發(fā)布全新AI推理系列大模型o1。該系列模型通過(guò)引入大規(guī)模強(qiáng)化學(xué)習(xí)算法，將模型思維展現(xiàn)為思維鏈，從而顯著提高了模型通用推理能力和對(duì)齊效果。根據(jù)OpenAI官方測(cè)評(píng)，o1不僅在絕大多數(shù)推理任務(wù)中表現(xiàn)優(yōu)于GPT-4o，甚至在部分推理密集型基準(zhǔn)測(cè)試中可與人類專家相媲美。推理性能提升的同時(shí)，o1系列模型推理算力需求大幅提升，o1-preview定價(jià)約為GPT-4o的12倍，后續(xù)降本值得關(guān)注。

投資層面看，盡管o1系列模型純文字輸出形式限制了其應(yīng)用場(chǎng)景，但是隨著底層算法能力提升帶來(lái)的通用推理能力的進(jìn)步，中信證券認(rèn)為AI爆款應(yīng)用有望從科研、編程等高價(jià)值場(chǎng)景起率先解鎖，軟件、互聯(lián)網(wǎng)有望率先受益。除去應(yīng)用端的投資機(jī)會(huì)，硬件端的需求也必然會(huì)隨著多模態(tài)的技術(shù)進(jìn)步而不斷提高，中信證券仍然持續(xù)看好 AI 算力層面，尤其是得益于商業(yè)端逐步成熟而帶來(lái)的更多的 AI 推理側(cè)算力的機(jī)會(huì)。

中信證券主要觀點(diǎn)如下：

事項(xiàng)：

北京時(shí)間9月13日凌晨，全球AI產(chǎn)業(yè)領(lǐng)頭羊OpenAI正式發(fā)布一系列旨在專門(mén)解決復(fù)雜任務(wù)的全新AI推理大模型o1，即之前醞釀已久的草莓模型。根據(jù)OpenAI官方推特，o1系列模型將包括o1、o1-preview和o1-mini，其中o1-preview已開(kāi)放使用，ChatGPT Plus和Team的用戶以及API使用等級(jí)達(dá)到5級(jí)（API付費(fèi)超1000美元）的開(kāi)發(fā)者已獲得該模型訪問(wèn)權(quán)限，企業(yè)版和教育版的用戶預(yù)計(jì)將從9月16日起獲得該模型訪問(wèn)權(quán)限。與此前The information、The medium等媒體報(bào)道基本一致，o1模型在功能、推理和性能表現(xiàn)上基本符合預(yù)期。

模型機(jī)理及評(píng)測(cè)效果：強(qiáng)化學(xué)習(xí)加持下編碼/數(shù)學(xué)/推理能力提升顯著。

根據(jù)OpenAI技術(shù)博客，o1模型在訓(xùn)練過(guò)程中引入了大規(guī)模強(qiáng)化學(xué)習(xí)算法，從而加強(qiáng)了其執(zhí)行復(fù)雜推理任務(wù)的能力。而根據(jù)“Reinforcement learning: An introduction”（Sutton），強(qiáng)化學(xué)習(xí)起源于上世紀(jì)60年代，旨在通過(guò)獎(jiǎng)懲機(jī)制讓智能體在復(fù)雜環(huán)境中最大限度獲得長(zhǎng)期全局最優(yōu)收益。強(qiáng)化學(xué)習(xí)主要包括定義問(wèn)題、選擇策略、學(xué)習(xí)價(jià)值函數(shù)（如Q學(xué)習(xí)）、模型控制和策略優(yōu)化等步驟。此前谷歌圍棋機(jī)器人AlphaGo的核心技術(shù)即為強(qiáng)化學(xué)習(xí)。在應(yīng)用該項(xiàng)技術(shù)后，o1系列模型的輸出過(guò)程與GPT系列模型存在顯著不同：o1系列模型會(huì)先用至多20~30秒產(chǎn)生較長(zhǎng)的思維鏈再進(jìn)行輸出，即先將復(fù)雜任務(wù)拆解為子任務(wù)進(jìn)行分析，在匯總子任務(wù)結(jié)果后輸出最終結(jié)果，而非GPT系列模型立即開(kāi)始生成的模式。根據(jù)OpenAI官網(wǎng)，o1模型在理科測(cè)試、數(shù)學(xué)、編程等絕大多數(shù)推理任務(wù)中表現(xiàn)明顯優(yōu)于GPT-4o，甚至在部分推理密集型基準(zhǔn)測(cè)試中o1模型的表現(xiàn)與人類專家相媲美。例如，在國(guó)際奧林匹克資格考試中，o1正確解答了83%的題目，而GPT-4o僅正確解答13%；在PhD水平科學(xué)問(wèn)答測(cè)試中，o1和o1-preview表現(xiàn)均優(yōu)于人類專家與GPT-4o。

市場(chǎng)定位：安全性與推理能力顯著提升有望解鎖應(yīng)用，模型成本有待優(yōu)化。

根據(jù)OpenAI官方技術(shù)博客，思維鏈可有效提升模型的安全和對(duì)齊水平：1）思維鏈可清晰的展示模型思維；2）將模型行為策略整合到推理模型的思維鏈中，可以高效、穩(wěn)健地教導(dǎo)人類價(jià)值觀。我們認(rèn)為，目前AI產(chǎn)業(yè)的主要矛盾是推理能力不足和成本過(guò)高導(dǎo)致的爆款應(yīng)用匱乏。而在安全性有保障的前提下，推理能力的顯著提升使得o1有望逐步解鎖應(yīng)用。但由于龐大的推理算力需求導(dǎo)致的高成本和純文字反饋的輸出形態(tài)，我們預(yù)計(jì)短期內(nèi)o1的應(yīng)用場(chǎng)景仍將集中于編程和科研等特定高價(jià)值生產(chǎn)力場(chǎng)景，OpenAI官方亦推出了更加擅長(zhǎng)編程的且更便宜的推理模型o1-mini。根據(jù)OpenAI官網(wǎng)，o1-preview定價(jià)為輸入端15美元/百萬(wàn)token，輸出端60美元/百萬(wàn)token；o1-mini的定價(jià)為輸入端3美元/百萬(wàn)token，輸出端12美元/百萬(wàn)token；GPT-4o的定價(jià)為輸入端1.25美元/百萬(wàn)token，輸出端為5美元/百萬(wàn)token。當(dāng)前GitHub Copilot團(tuán)隊(duì)版和企業(yè)版官網(wǎng)定價(jià)分別為4美元和21美元每月，我們認(rèn)為o1模型的后續(xù)成本優(yōu)化值得關(guān)注。

趨勢(shì)展望：推理階段有望遵循Scaling Law，多模型配合值得關(guān)注。

在研發(fā)o1模型時(shí)，OpenAI發(fā)現(xiàn)給予模型更多的推理時(shí)間可有效提高模型的性能，即推理階段的Scaling Law。這一發(fā)現(xiàn)在一定程度上意味著推理端的算力需求有望迎來(lái)蓬勃增長(zhǎng)。同時(shí)目前o1系列模型的訪問(wèn)限制也從側(cè)面證明了模型算力需求之旺盛。根據(jù)OpenAI官網(wǎng)，目前o1-preview使用限制為每周30條，o1-mini為每周50條。此外，我們認(rèn)為，應(yīng)用層面的多模型配合亦值得關(guān)注。根據(jù)“Merge, Ensemble, and Cooperate! A Survey on Collaborative Strategies in the Era of Large Language Models”（Jinliang Lu, Ziliang Pang, Min Xiao等），多模型協(xié)作具有整體性能提升、多任務(wù)處理能力增強(qiáng)、計(jì)算效率提升、錯(cuò)誤與幻覺(jué)減少、知識(shí)共享與能力遷移等優(yōu)勢(shì)。多模型協(xié)作既可發(fā)生在大模型之間，也可發(fā)生在大模型與小模型之間。多模型協(xié)作策略可分為融合、集成和合作三種，其中合作方法下不同模型兼容度最高最為靈活，可創(chuàng)造出更加全面高效的AI系統(tǒng)，因此具備相當(dāng)潛力。

風(fēng)險(xiǎn)因素：

AI核心技術(shù)發(fā)展不及預(yù)期風(fēng)險(xiǎn)；科技領(lǐng)域政策監(jiān)管持續(xù)收緊風(fēng)險(xiǎn)；私有數(shù)據(jù)相關(guān)的政策監(jiān)管風(fēng)險(xiǎn)；全球宏觀經(jīng)濟(jì)復(fù)蘇不及預(yù)期風(fēng)險(xiǎn)；宏觀經(jīng)濟(jì)波動(dòng)導(dǎo)致歐美企業(yè)IT支出不及預(yù)期風(fēng)險(xiǎn)；AI潛在倫理、道德、用戶隱私風(fēng)險(xiǎn)；企業(yè)數(shù)據(jù)泄露、信息安全風(fēng)險(xiǎn)；行業(yè)競(jìng)爭(zhēng)持續(xù)加劇風(fēng)險(xiǎn)等。

投資策略：

本次o1系列模型的更新仍然是圍繞底層算法層面，尤其是大語(yǔ)言模型的推理能力。從技術(shù)角度，o1系列大模型的基礎(chǔ)能力在大規(guī)模強(qiáng)化學(xué)習(xí)方法加持下在得到顯著提升，不僅證明了在scale繼續(xù)堆規(guī)模和訓(xùn)練計(jì)算投入的道路上仍有不斷的迭代空間，更表明推理階段有望繼續(xù)遵循Scaling Law，從而帶來(lái)推理端算力需求的大幅增長(zhǎng)。應(yīng)用層面，盡管o1系列模型僅有文字輸出能力限制了其應(yīng)用場(chǎng)景的開(kāi)闊，但是隨著底層算法能力提升帶來(lái)的通用推理能力的進(jìn)步，我們認(rèn)為AI爆款應(yīng)用有望從科研、編程等高價(jià)值場(chǎng)景起率先解鎖，軟件、互聯(lián)網(wǎng)有望率先受益。除去應(yīng)用端的投資機(jī)會(huì)，硬件端的需求也必然會(huì)隨著多模態(tài)的技術(shù)進(jìn)步而不斷提高，我們?nèi)匀怀掷m(xù)看好 AI 算力層面，尤其是得益于商業(yè)端逐步成熟而帶來(lái)的更多的 AI 推理側(cè)算力的機(jī)會(huì)。

【免責(zé)聲明】本文僅代表作者本人觀點(diǎn)，與和訊網(wǎng)無(wú)關(guān)。和訊網(wǎng)站對(duì)文中陳述、觀點(diǎn)判斷保持中立，不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考，并請(qǐng)自行承擔(dān)全部責(zé)任。郵箱：[email protected]

本文由紅麻子于2024-09-17發(fā)表在七臺(tái)河市金德風(fēng)筒制造有限公司，如有疑問(wèn)，請(qǐng)聯(lián)系我們。
本文鏈接：http://m.platosclosethighpoint.com/post/6251.html

上一篇
谷歌因環(huán)保問(wèn)題將智利數(shù)據(jù)中心計(jì)劃推回原點(diǎn)

下一篇
騰盛博藥-B(02137)根據(jù)獲采納首次公開(kāi)發(fā)售后股份獎(jiǎng)勵(lì)計(jì)劃發(fā)行合共7.03萬(wàn)股