內地AI新創公司DeepSeek日前推出的人工智能AI「DeepSeek R1」引起市場關注,更在中國及美國的蘋果應用商店免費下載排行榜中成為榜首。DeepSeek的崛起令不少人好奇背後開發者的真實身份。有媒體近日就找出DeepSeek的背後推手,原來是一名來自四川的95後AI天才少女。
DeepSeek 羅福莉 梁文鋒
DeepSeek爆紅震撼AI市場
內地AI新創公司DeepSeek日前先後推出「DeepSeek- V3」及「DeepSeek R1」模型後,旋即獲得市場關注,因其成本較其他AI模型低,但性能就與AI龍頭程式OpenAI相若。應用程式更在中國及美國的蘋果應用商店免費下載排行榜中登頂,在美國的下載榜更超越ChatGPT。
DeepSeek拖累nvda股價重挫暴瀉17%
DeepSeek的爆紅連帶影響美國股市,1月27日「股王」輝達Nvidia股價受重挫,暴瀉17%,單日蒸發近6,000億美元,分析指DeepSeek的應用引發市場對於人工智能模型開發成本的疑問。
95後AI天才美少女羅福莉有份開發
隨著DeepSeek爆紅,有人就揭開背後開發者的真實身份,有網上消息指來自四川的95後少女羅福莉曾參與DeepSeek開發。根據內地媒體介紹,羅福莉來自四川小城一個普通家庭,誤打誤撞進入北京師範大學計算機專業後,憑住個人努力及天賦,終由大一時的吊車尾,成為班上前幾名,更獲保送至北京大學計算語言學研究所。羅福莉之前接受訪問時曾提及,自己家庭條件並不好,但是家庭給了她勇氣,讓她相信相信的力量。而她的父母一開始覺得女生不適合學電腦,但羅福莉直言: 「我想探索更多可能性。」
在北大就讀研究所期間,羅福莉曾在人工智慧領域頂級國際會議ACL上發表8篇論文走紅,其中2篇當時更登上內地問答網站「知乎」的熱搜。而畢業前,她成功拿下多間大公司的工作,包括阿里星、騰訊技術大咖、百度AIDU計畫等等。
傳羅福莉被小米以千萬年薪挖走
碩士畢業後,羅福莉加入阿里達摩院機器智能實驗室,並主導開發多語言預訓練模型VECO。她在2022年加入幻方量化從事深度學習相關策略建模和演算法研究,後來跳槽到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。羅福莉的高中班主任就證實了這個說法,惟當內地記者委託對方向羅福莉轉達採訪請求時,羅福莉就表示暫不方便接受採訪。有傳小米創始人雷軍在「DeepSeek- V3」發布前,以千萬年薪聘請羅福莉領導小米AI大模型團隊。
羅福莉曾在知乎上撰文表示,「單論DeepSeek-V2模型的中文水平,是真實處在國內外閉源模型的第一梯隊,外加1元/百萬輸入Tokens的價格,只有GPT4價格的1/100,性價比之王。」
DeepSeek團隊不到140人 均來自頂尖院校
另外根據《極目新聞》報道,DeepSeek團隊不到140人,規模不大,但成員大多來自清華、北大、北航等頂尖院校的應屆博士畢業生、在學生以及碩士生,而且大多較為年輕,年紀也多在35歲以下。而DeepSeek創始人梁文鋒畢業於浙江大學,擁有資訊與電子工程學系本科及碩士學位。他曾表示:「在人工智慧領域,前50名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。」
DeepSeek創始人「85後」梁文鋒是誰?
「85後」梁文鋒畢業後創業,用AI炒股投資,現為DeepSeek創始人。
浙江大學電子信息工程專業碩士畢業生,於浙大同學徐進合作創立了杭州雅克比投資管理有限公司,以及杭州幻方科技有限公司。這兩家公司專注於數學和人工智能的應用,致力於量化投資。自2015年以來,幻方公司在市場波動中憑藉先進的高頻量化策略取得了顯著成就。梁文鋒於2002年以「高考狀元」的成績考入浙江大學,並於2010年獲得信息與通信工程碩士學位。在2008年全球金融危機期間,他率領團隊探索了機器學習技術在全自動量化交易中的應用潛力。
相關文章:
資料來源:極目新聞、Deepseek