1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. AI智能
  4. 正文

MagicHub.語音開源社區(qū)正式上線 Dan Povey等大咖為社區(qū)打call

 2021-04-18 10:16  來源:互聯網  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領券再下單

1969年,Unix 源代碼在 Unix 社區(qū)自由共享,人類歷史上首次發(fā)起開源動作;

1991年,開源系統Linux內核問世;

1998年,網景通訊將源代碼開放,“開源”一詞首次出現;

2005年, 一個叫Git 的SCM工具出現,托管式的Git 代碼倉庫誕生;

……

開源,已經扎根在互聯網基因深處,深刻改變互聯網發(fā)展模式。

開源的歷史,儼然是一部波瀾壯闊的互聯網發(fā)展史。

自達特茅斯會議人工智能概念提出以來,人工智能發(fā)展多次起落,隨著技術的變革,互聯網、大數據、云計算、5G的發(fā)展,人工智能在人類舞臺正式大展拳腳。

人工智能開啟了人類下一個紀元,開源繼續(xù)扮演著重要角色,用于機器學習和AI訓練的數據開源平臺先后涌現,開發(fā)者們繼續(xù)貢獻著人類的智慧,開源、開放、自由和協作的精神推動人工智能不斷發(fā)展。

政府、公益機構和個人將數據分享出來,為全球人工智能輸送“燃料”,越來越多公司、大學、團體和個人也加入開源隊伍,Kaggle、UCI、OpenML、ImageNet、OpenSLR等平臺開源了大量圖像、文本和語音數據。數據成為人工智能領域開源精神的核心載體。

圖:MagicHub數據開源社區(qū)正式發(fā)布

在此背景下,MagicHub.io數據開源社區(qū)(https://magichub.io)應運而生,并于4月15日正式發(fā)布。愛數智慧目前擁有全球領先的對話式AI語音數據集,并在業(yè)界首次通過自主開發(fā)的開源平臺與第三方的各產業(yè)伙伴進行共享,這可能會顛覆目前的產能瓶頸以及用戶的數據使用習慣。

語音識別開源工具Kaldi之父Daniel Povey等數十位國內外開發(fā)者、人工智能領域大咖為MagicHub.io數據開源社區(qū)瘋狂打CALL。

大量結構化、多領域和多場景數據集上傳到MagicHub.io社區(qū),社區(qū)對數據集多維度細分,幫助AI開發(fā)者快速找到適合自己模型的數據集,從而節(jié)省開發(fā)者大量精力,將時間專注在模型開發(fā)和優(yōu)化上。

MagicHub.io數據開源社區(qū)秉持“共享共建、奉獻創(chuàng)新,共同發(fā)展”精神,部分數據由愛數智慧上傳,同時鼓勵其他個人和團體在開源社區(qū)上傳高質量、可靠的數據集,有開源數據需求可聯系我們,讓我們一起連接數據生產者與AI開發(fā)者,互相護持,構建創(chuàng)新。

圖:MagicHub開源社區(qū)首頁頁面

目前,MagicHub.io數據開源社區(qū)首次開源30種用于人工智能訓練/測試的數據集,包括中文對話數據集、中文客服數據集、英語對話數據集、上海方言對話數據集等。開源的數據集涵蓋NLP、ASR、TTS數據集和LEX發(fā)音詞典等,這些數據集按照語言、場景、應用領域等不同維度進行分類。

接下來,我們將在MagicHub.io社區(qū)持續(xù)開源高質量的數據集,并且增加更多板塊,讓MagicHub.io社區(qū)持續(xù)貢獻,讓創(chuàng)新和分享組成一股力量,共同打造一個高質量的人工智能數據開源社區(qū)。

開源是推動科技創(chuàng)新的一大源頭,開源社區(qū)的打造已上升到國家層面,鼓勵開源社區(qū)發(fā)展,健全知識產權體系。《“十四五”規(guī)劃和2035年遠景目標綱要》提到,要“支持數字技術開源社區(qū)等創(chuàng)新聯合體發(fā)展,完善開源知識產權和法律體系,鼓勵企業(yè)開放軟件源代碼、硬件設計和應用服務。”

人工智能開啟開源的下一個紀元,你我一起參與!

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
人工智能

相關文章

  • GDPS2025賽場直擊!開普勒大黃蜂助力華理斬獲搬運賽項桂冠

    12月12日-14日,2025全球開發(fā)者先鋒大會暨國際具身智能技能大賽(GDPS2025)于上海張江科學會堂舉行,大會以具身智能競技為核心,融合了技術比拼、產業(yè)展示與科普體驗,為全球觀眾呈現出具身智能的現在與未來。上海開普勒機器人有限公司(以下簡稱"開普勒機器人")攜明星產品K2"大黃蜂"亮相,并參

    標簽:
    GDPS
    2025
  • 弈動 Dynamic·數智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術的演進正引領產業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學者、高??蒲袡C構和企業(yè)的權威專家與業(yè)界精英齊聚北京,共議AI安全、數

    標簽:
    弈動
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術學會、中科先進技術溫州研究院與溫州市電力工程學會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標簽:
    ai技術
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內循環(huán)”

    我覺得我們AI的目標是:從芯片設計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產開車26年國產芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數AI大模型會以軟件彌補硬件不足,所以訓練和推理分開,訓練就

  • H20芯片開賣即叫停,英偉達如何解圍?

    文/道哥在深陷“后門”風波、接受網信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關鍵供應商——包括負責封裝的安靠科技、供應高帶寬內存的三星電子、以及承擔后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標簽:
    英偉達