Mike Stonebraker,這位2014年圖靈獎得主,因其在數(shù)據(jù)庫系統(tǒng)領域的開創(chuàng)性貢獻而廣受贊譽。從Ingres、Postgres到Vertica、VoltDB、SciDB,再到最近的DBOS,他參與開發(fā)的每一個項目都深刻影響了商業(yè)數(shù)據(jù)庫的發(fā)展。近期,Stonebraker在meta資深工程師Ryan Peterman的播客中,分享了他對數(shù)據(jù)庫行業(yè)、AI技術以及職業(yè)選擇的獨到見解。
Stonebraker的數(shù)據(jù)庫生涯始于伯克利大學。1971年,當Ted Codd的關系數(shù)據(jù)庫理論剛剛發(fā)表時,Stonebraker在導師Gene Wong的帶領下,開始探索這一新興領域。他們開發(fā)的Ingres系統(tǒng),不僅在學術界廣受歡迎,還成功商業(yè)化,成為Oracle等競爭對手的有力挑戰(zhàn)者。Stonebraker直言不諱地批評Oracle創(chuàng)始人Larry Ellison的銷售策略,認為其通過混淆現(xiàn)在時和將來時來誤導客戶,是不可原諒的行為。
在談到數(shù)據(jù)庫設計的靈活性時,Stonebraker以Postgres為例,強調了可擴展類型系統(tǒng)的重要性。他回憶起一個債券交易員的電話,該交易員因數(shù)據(jù)庫無法支持其特定的日期計算需求而苦惱。這一經歷促使Stonebraker在Postgres中引入了可自定義的數(shù)據(jù)類型,使得數(shù)據(jù)庫能夠高效處理各種抽象數(shù)據(jù)類型,從而大大擴展了其應用范圍。
對于當前數(shù)據(jù)庫行業(yè)的趨勢,Stonebraker認為“一種數(shù)據(jù)庫通吃所有場景”的觀點是錯誤的。他指出,不同的工作負載需要不同類型的數(shù)據(jù)庫解決方案。例如,流處理、數(shù)據(jù)倉庫和文本向量處理等場景,分別需要流處理數(shù)據(jù)庫、列式數(shù)據(jù)庫和向量數(shù)據(jù)庫等不同類型的系統(tǒng)。他批評了Google早期推廣的MapReduce和最終一致性模型,認為這些技術在性能和數(shù)據(jù)完整性方面存在嚴重缺陷。
在AI技術方面,Stonebraker對當前多數(shù)agentic AI的“只讀”特性表示擔憂。他認為,一旦AI開始進行讀寫操作,如兩個agent協(xié)作完成轉賬,數(shù)據(jù)庫的事務、一致性和原子性等問題將再次成為關鍵。他通過實驗發(fā)現(xiàn),在大模型寫SQL的任務中,即使在公開基準上表現(xiàn)良好的模型,在真實生產數(shù)據(jù)倉庫上的準確率也極低。他因此得出結論,這項技術至少在短期內還不足以進入生產環(huán)境。
在職業(yè)選擇方面,Stonebraker給出了出人意料的建議。他認為,計算機科學未來不一定是一個增長行業(yè),因此不太確定是否會推薦18歲的年輕人主修計算機科學。相反,他認為醫(yī)療和建筑等行業(yè)是更穩(wěn)妥的選擇。對于即將獲得博士學位并決定未來方向的人,他建議選擇最有聲望的工作,找一個愿意幫助的導師,并選擇一個不隨大流的研究方向。















