国产激情一区二区三区,精品欧美一区二区在线观看,日本不卡一区二区三区

Qodo推出開源代碼嵌入模型,性能超越OpenAI和Salesforce

2025-03-03 14:31  瀏覽:  

Qodo,前身為Codium,是一家專注于人工智能驅動的代碼質量平臺的公司。近日,該公司發布了Qodo-Embed-1-1.5B,這是一款開源的代碼嵌入模型,擁有15億個參數,旨在提升代碼搜索、檢索和理解的能力。該模型在行業基準測試中表現優異,超越了OpenAI和Salesforce的大型模型,同時以更小的規模和更高的效率樹立了新的企業標準。

對于管理龐大復雜代碼庫的企業開發團隊來說,Qodo-Embed-1-1.5B代表了AI驅動軟件工程工作流程的重大進步。通過實現更準確、更高效的代碼檢索,該模型解決了AI輔助開發中的關鍵挑戰——大型軟件系統中的上下文感知問題。

代碼嵌入模型的重要性

AI驅動的編碼工具傳統上側重于代碼生成,大型語言模型(LLM)因其編寫新代碼的能力而備受關注。然而,Qodo的首席執行官兼聯合創始人Itamar Friedman指出:“企業軟件可能包含數千萬甚至數億行代碼。僅僅生成代碼是不夠的,還需要確保代碼質量高、功能正常,并與系統的其他部分無縫集成。”

代碼嵌入模型在AI輔助開發中扮演著關鍵角色,能夠有效搜索和檢索相關代碼片段。這對于代碼量龐大、涉及多個團隊、存儲庫和編程語言的大型組織尤為重要。Friedman強調:“在當今的軟件開發中,上下文至關重要。要從龐大的代碼庫中獲取正確的上下文,必須依賴高效的搜索機制。”

Qodo-Embed-1-1.5B的性能與效率

Qodo-Embed-1-1.5B以其高效性和準確性脫穎而出。盡管許多先進模型依賴數十億個參數(如OpenAI的text-embedding-3-large擁有70億個參數),Qodo的模型僅用15億個參數就實現了卓越的性能。在代碼信息檢索基準(CoIR)測試中,Qodo-Embed-1-1.5B得分為70.06,優于Salesforce的SFR-Embedding--2_R(67.41)和OpenAI的text-embedding-3-large(65.17)。

這種性能水平對企業尤為重要,因為該模型能夠在低成本GPU上運行,降低了基礎設施成本,同時提高了軟件質量和開發效率。

解決代碼復雜性與細微差別

AI驅動軟件開發中的一大挑戰是外觀相似的代碼可能具有截然不同的功能。Friedman舉例說明:“嵌入代碼的最大挑戰之一是,兩個幾乎相同的函數(如‘withdraw’和‘deposit’)可能只差一個加號或減號。它們在向量空間中需要接近,但又必須明顯區分。”

為了解決這一問題,Qodo開發了一種獨特的訓練方法,結合高質量的合成數據和真實代碼樣本。通過與Nvidia和AWS的合作,Qodo改進了模型訓練過程,使其能夠識別功能相似代碼中的細微差異,確保開發人員檢索到正確的結果。

多語言支持與未來擴展

Qodo-Embed-1-1.5B已針對10種最常用的編程語言(包括Python、JavaScript和Java)進行了優化,并支持其他語言和框架。未來,Qodo計劃進一步擴展模型功能,提供更深入的企業開發工具集成和更多語言支持。

Friedman表示:“許多嵌入模型難以區分編程語言,有時會混淆來自不同語言的代碼片段。我們專門訓練了模型以防止這種情況,重點關注企業開發中最常用的10種語言。”

企業部署與可用性

Qodo通過多種渠道提供其新模型。1.5B參數版本可在Hugging Face上免費獲取,采用OpenRAIL++-M許可證,允許開發人員自由集成到工作流程中。企業用戶可選擇商業許可版本,獲取更多功能。此外,Qodo還提供企業級平臺,能夠自動更新代碼嵌入,確保模型在代碼庫變化時保持準確性。

該模型還將通過Nvidia的NIM平臺和AWS SageMaker JumpStart提供,便于企業部署和集成到現有開發環境中。

AI在企業軟件開發中的未來

隨著AI驅動的編碼工具快速發展,其重點正從代碼生成轉向代碼理解、檢索和質量保證。Qodo-Embed-1-1.5B等工具將在使AI系統更可靠、高效和經濟高效方面發揮關鍵作用。

Friedman總結道:“對于財富15,000強企業的開發人員來說,AI不僅僅是代碼生成工具。他們的工作流程需要對大型代碼庫有深入理解。高質量的代碼嵌入模型正是解決這一需求的關鍵。”

Qodo的最新模型為企業在復雜軟件生態系統中理解、管理和優化代碼提供了高性能的解決方案,標志著AI在軟件開發中的應用邁出了重要一步。

免責聲明:本網轉載自合作媒體、機構或其他網站的信息,登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性。本網所有信息僅供參考,不做交易和服務的根據。本網內容如有侵權或其它問題請及時告之,本網將及時修改或刪除。凡以任何方式登錄本網站或直接、間接使用本網站資料者,視為自愿接受本網站聲明的約束。
相關推薦
特朗普誓言廢除520億美元半導體芯片法案

特朗普誓言廢除520億美元半導體芯片法案

當地時間3月4日,美國總統特朗普在國會聯席會議上發表演講,誓言要廢除前任總統拜登簽署的《芯片和科學法案》中涉及的520億美元半導體芯片補貼計劃。特朗普在演講中明確表示,這筆資金應該被用于減少國家債務,而不是向芯片制造商提供補貼。特朗普強調,他的政策導向是務實的財政管理,而非通過大規模補貼來推動特定產業發展。他指出,利用《芯片和科學法案》的資金來減少債務,將更符合美國的長遠利益。該法案原本旨在通過提供約527億美元的資金補...
03-05
特朗普誓言廢除520億美元半導體芯片法案

特朗普誓言廢除520億美元半導體芯片法案

當地時間3月4日,美國總統特朗普在國會聯席會議上發表演講,誓言要廢除前任總統拜登簽署的《芯片和科學法案》中涉及的520億美元半導體芯片補貼計劃。特朗普在演講中明確表示,這筆資金應該被用于減少國家債務,而不是向芯片制造商提供補貼。特朗普強調,他的政策導向是務實的財政管理,而非通過大規模補貼來推動特定產業發展。他指出,利用《芯片和科學法案》的資金來減少債務,將更符合美國的長遠利益。該法案原本旨在通過提供約527億美元的資金補...
Qodo推出開源代碼嵌入模型,性能超越OpenAI和Salesforce

Qodo推出開源代碼嵌入模型,性能超越OpenAI和Salesforce

Qodo,前身為Codium,是一家專注于人工智能驅動的代碼質量平臺的公司。近日,該公司發布了Qodo-Embed-1-1.5B,這是一款開源的代碼嵌入模型,擁有15億個參數,旨在提升代碼搜索、檢索和理解的能力。該模型在行業基準測試中表現優異,超越了OpenAI和Salesforce的大型模型,同時以更小的規模和更高的效率樹立了新的企業標準。對于管理龐大復雜代碼庫的企業開發團隊來說,Qodo-Embed-1-1.5B代表了AI驅動軟件工程工作流程的重大進步。通過實現更準確、更高...
OpenAI計劃將Sora視頻生成器整合至ChatGPT

OpenAI計劃將Sora視頻生成器整合至ChatGPT

OpenAI近日宣布,計劃將其AI視頻生成工具Sora直接集成到其廣受歡迎的消費者聊天機器人應用ChatGPT中。這一消息是在OpenAI周五的Discord辦公時間會議上由公司領導層透露的。目前,Sora僅通過12月推出的專用Web應用程序提供,用戶可以通過該應用生成最長20秒的視頻片段。然而,OpenAI的Sora產品負責人Rohan Sahai表示,公司計劃將Sora擴展到更多平臺,并增強其生成能力。Sora最初在發布前的幾個月內主要面向創意人員和視頻制作工作室推廣。如今,Op...
亞馬遜通過模型混合、代理和瀏覽器使用重建Alexa

亞馬遜通過模型混合、代理和瀏覽器使用重建Alexa

亞馬遜正在通過混合模型、代理互作性和瀏覽器使用功能,重新設計其旗艦語音助手Alexa,使其更加智能和高效。新版本名為Alexa+,旨在提供更強大的功能,例如主動通知用戶他們最喜歡的作者是否有新書發布,或者他們最喜歡的藝術家是否在附近演出,甚至可以幫助購票。Alexa+通過推理和調用不同知識庫中的專家來回答用戶問題并完成任務。例如,它可以回答離辦公室最近的披薩店在哪里?我的同事會喜歡嗎?如果覺得他們會喜歡,就預訂吧。這種能力使Alexa+...

推薦閱讀

熱文

Copyright © 能源界
      1. 主站蜘蛛池模板: 温泉县| 武陟县| 正阳县| 日土县| 十堰市| 营山县| 丰都县| 峡江县| 鹿邑县| 石阡县| 广饶县| 松潘县| 英吉沙县| 常州市| 报价| 格尔木市| 洛隆县| 噶尔县| 潼南县| 安国市| 睢宁县| 黄陵县| 芒康县| 本溪市| 凌云县| 江源县| 红河县| 建昌县| 比如县| 甘肃省| 同心县| 班玛县| 张北县| 六盘水市| 桃园市| 贵港市| 包头市| 佛学| 麻栗坡县| 怀集县| 汤原县|