梁文鋒,男, [3]1985年出生于廣東省湛江市,浙江大學畢業(yè),擁有信息與電子工程學系本科和碩士學位。杭州幻方科技有限公司、DeepSeek創(chuàng)始人。 [1-2] 2008年起,梁文鋒開始帶領(lǐng)團隊使用機器學習等技術(shù)探索全自動量化交易。2015年,幻方量化正式成立。2019年,其資金管理規(guī)模突破百億元;同年,梁文鋒在當年的金牛獎頒獎儀式上發(fā)表主題演講《一名程序員眼里中國量化投資的未來》。2020年開始,幻方的AI超級計算機“螢火一號”正式投入運作。2021年,幻方投入十億建設(shè)“螢火二號”。2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式進軍通用人工智能領(lǐng)域。2024年5月,DeepSeek發(fā)布了DeepSeekV2;同年12月27日,DeepSeek-V3面世。2025年1月20日, DeepSeek正式發(fā)布DeepSeek-R1模型;同日,梁文鋒參加了中共中央政治局常委、國務(wù)院總理李強主持召開專家、企業(yè)家和教科文衛(wèi)體等領(lǐng)域代表座談會,并在會上發(fā)言。 [1-2] 中文名梁文鋒 國 籍中國 出生日期1985年 [1] 畢業(yè)院校浙江大學 [1] 就職企業(yè)DeepSeek [2] 杭州幻方科技有限公司 [2] 主要成就DeepSeek創(chuàng)始人 [1-2] 性 別男 [3] 目錄 1早年經(jīng)歷 2從業(yè)經(jīng)歷 3家庭關(guān)系 4主要貢獻 5社會活動 早年經(jīng)歷 播報 編輯 1985年,梁文鋒出生于廣東省湛江市 [1-2],在廣東一個五線城市長大。 [4]2002年,17歲的梁文鋒考入浙江大學電子信息工程專業(yè),屬于電子工程系人工智能方向。 [1-2] [4] 在校期間,他對金融市場產(chǎn)生了濃厚的興趣。特別在2008年全球金融危機之際,他帶領(lǐng)團隊探索了機器學習技術(shù)在全自動量化交易中的應(yīng)用潛力。 [5] 本科畢業(yè)后,在浙大攻讀碩士研究生,畢業(yè)論文題目是《基于低成本PTZ攝像機的目標跟蹤算法研究》, [1-2] [4]2010年,獲得信息與通信工程碩士學位。 [5] 從業(yè)經(jīng)歷 播報 編輯 2008年起,梁文鋒開始帶領(lǐng)團隊使用機器學習等技術(shù)探索全自動量化交易。 [1-2]2013年,他與浙大同學徐進共同創(chuàng)立了杭州雅克比投資管理有限公司。 [5] 2015年,成立了杭州幻方科技有限公司,致力于通過數(shù)學和人工智能進行量化投資。當年的市場波動中,幻方依靠先進的高頻量化策略取得了很好的成績。 [2] [5] 2016年是幻方的重要轉(zhuǎn)折點。 [5]10月21日,幻方量化推出第一個AI模型,實現(xiàn)了所有量化策略的AI化轉(zhuǎn)型。到2017年底,幾乎所有的量化策略都采用AI模型計算。 [4-5] 2018年,幻方正式確立了以AI為核心的發(fā)展戰(zhàn)略。隨著業(yè)務(wù)的快速擴展,算力瓶頸逐漸顯現(xiàn)。 [5]2019年,梁文鋒帶領(lǐng)團隊自主研發(fā)了“螢火一號”訓練平臺,總投資近2億元,搭載了1100塊GPU; [1]同年,梁文鋒在當年的金牛獎頒獎儀式上發(fā)表主題演講《一名程序員眼里中國量化投資的未來》 [2]。2020年開始,幻方累計投資超億元、占地面積相當于一個籃球場的AI超級計算機“螢火一號”正式投入運作,號稱可以匹敵4萬臺個人電腦的超級算力。 [2] 2021年,“螢火二號”的投入增加到10億元,搭載了約1萬張英偉達A100顯卡; [2]幻方的資產(chǎn)管理規(guī)模突破千億大關(guān),躋身國內(nèi)量化私募領(lǐng)域的“四大天王”之列。 [1] 2023年5月,梁文鋒宣布做通用人工智能(AGI)。7月,幻方量化宣布成立大模型公司DeepSeek,即杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,正式進軍通用人工智能領(lǐng)域。 [2] [4] 2024年5月,DeepSeek發(fā)布了DeepSeekV2。DeepSeek-V2的API定價為每百萬tokens輸入1元、輸出2元,價格僅為GPT-4 Turbo的百分之一。 [2] [5]同年12月27日,DeepSeek-V3面世,并公布了長達53頁的訓練和技術(shù)細節(jié)。 [2] 2025年1月20日, DeepSeek正式發(fā)布DeepSeek-R1模型。 [1-2] 家庭關(guān)系 播報 編輯 父親是小學老師。 [4] 主要貢獻 播報 編輯 2019年,梁文鋒帶領(lǐng)團隊自主研發(fā)了“螢火一號”訓練平臺,總投資近2億元,搭載了1100塊GPU。兩年后,“螢火二號”的投入增加到10億元,搭載了約1萬張英偉達A100顯卡。 [1-2] 2021年,在梁文鋒參與的論文中提到,他們正在部署的螢火二號系統(tǒng),“配備了1萬張A100GPU芯片”,在性能上接近DGX-A100(英偉達推出的人工智能專用超級計算機),但成本降低了一半,同時能耗減少了40%。 [2] 2021年,幻方的資產(chǎn)管理規(guī)模突破千億大關(guān),躋身國內(nèi)量化私募領(lǐng)域的“四大天王”之列。 [1-2] 2023年,他宣布將正式進軍通用人工智能領(lǐng)域,并創(chuàng)辦了深度求索DeepSeek,專注于做真正人類級別的人工智能。 2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式進軍通用人工智能領(lǐng)域。梁文鋒為創(chuàng)始人。 [2] 2024年5月,DeepSeek發(fā)布混合專家語言模型DeepSeek-V2。同年12月,DeepSeek-V3問世,這款性能優(yōu)越且性價比極高的大語言模型,被硅谷同行譽為“來自東方的神秘力量”。 [1] 社會活動 播報 編輯 2025年1月20日,梁文鋒參加了中共中央政治局常委、國務(wù)院總理李強主持召開專家、企業(yè)家和教科文衛(wèi)體等領(lǐng)域代表座談會,并在會上發(fā)言。 [1-2] 百度百科內(nèi)容由網(wǎng)友共同編輯,如您發(fā)現(xiàn)自己的詞條內(nèi)容不準確或不完善,歡迎使用本人詞條編輯服務(wù)(免費)參與修正。立即前往>> 詞條圖冊更多圖冊 梁文鋒 (1張) 參考資料 1DeepSeek創(chuàng)始人梁文鋒參加總理座談會,這家杭州公司藏不住了.錢江晚報 [引用日期2025-01-21] 2量化巨頭幻方創(chuàng)始人梁文鋒參加總理座談會并發(fā)言,他還創(chuàng)辦了“AI界拼多多”.澎湃新聞 [引用日期2025-01-23] 3“85后”廣東小伙,緣何成為李強總理“座上賓”?.新浪財經(jīng) [引用日期2025-01-27] 4這家杭州科技公司創(chuàng)始人 為何成為總理的“座上賓”?.杭州網(wǎng) [引用日期2025-01-27] 5DeepSeek創(chuàng)始人梁文鋒參加總理座談會,這家杭州科技公司有多厲害.錢江晚報 [引用日期2025-01-27]
DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技公司,專注于開發(fā)先進的大語言模型(LLM)和相關(guān)技術(shù)。 [4]注冊地位于浙江省杭州市拱墅區(qū)環(huán)城北路169號匯金國際大廈西1幢1201室,法定代表人為裴湉。 [7] DeepSeek的經(jīng)營范圍包括技術(shù)服務(wù)、技術(shù)開發(fā);軟件開發(fā)等。 [7]2024年1月5日,發(fā)布DeepSeek LLM,這是深度求索的第一個大模型。 [10]2024年1月25日,發(fā)布DeepSeek-Coder。 [10]2024年2月5日,發(fā)布DeepSeekMath。 [10]2024年3月11日,發(fā)布DeepSeek-VL。 [10]2024年5月7日,發(fā)布DeepSeek-V2。 [10]2024年6月17日,發(fā)布DeepSeek-Coder-V2。 [10]2024年9月5日,DeepSeek 官方更新 API 支持文檔,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 兩個模型,升級推出全新的 DeepSeek V2.5 新模型。 [8]2024年12月13日,發(fā)布用于高級多模態(tài)理解的專家混合視覺語言模型——DeepSeek-VL2。 [10]2024年12月26日晚,AI公司深度求索(DeepSeek)正式上線全新系列模型DeepSeek-V3首個版本并同步開源。 [1-2]12月30日,中信證券研報指出,DeepSeek-V3的正式發(fā)版引起AI業(yè)內(nèi)廣泛高度關(guān)注,其在保證了模型能力的前提下,訓練效率和推理速度大幅提升。中信證券研報評價DeepSeek-V3,“DeepSeek新一代模型的發(fā)布意味著AI大模型的應(yīng)用將逐步走向普惠,助力AI應(yīng)用廣泛落地;同時訓練效率大幅提升,亦將助力推理算力需求高增。我們持續(xù)看好AI產(chǎn)業(yè)鏈的加速落地機遇,建議重點關(guān)注AI應(yīng)用、AI Infra、AI算力三大主線。”