當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

亮相CCIG2022,合合信息以智能文字識(shí)別技術(shù)挑戰(zhàn)傳統(tǒng)OCR應(yīng)用難題

 2022-08-26 16:35  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

近期,2022中國(guó)圖象圖形大會(huì)(CCIG 2022)在成都圓滿落幕。本次大會(huì)由中國(guó)科學(xué)技術(shù)協(xié)會(huì)指導(dǎo),中國(guó)圖象圖形學(xué)學(xué)會(huì)主辦,四川大學(xué)承辦,電子科技大學(xué)協(xié)辦,匯聚了潘云鶴院士、鄭南寧院士、高文院士、戴瓊海院士、王耀南院士、喬紅院士等百余位國(guó)內(nèi)知名學(xué)者,以及來(lái)自百度、華為、OPPO、合合信息等企業(yè)的技術(shù)專家,共話圖像圖形學(xué)術(shù)研究與技術(shù)創(chuàng)新趨勢(shì),共謀行業(yè)新發(fā)展,參會(huì)人數(shù)突破1500人。

大會(huì)采用主旨報(bào)告與主題/特色論壇的方式進(jìn)行。其中,在主旨報(bào)告環(huán)節(jié)里,中國(guó)工程院院士、浙江大學(xué)教授潘云鶴院士介紹了視覺(jué)知識(shí)與視覺(jué)智能的相關(guān)工作,闡釋了人工智能發(fā)展的過(guò)程中,視覺(jué)智能起到的重要的作用。本次大會(huì)還設(shè)置了涵蓋OCR、圖像理解、計(jì)算機(jī)視覺(jué)、人機(jī)交互、類腦視覺(jué)、AR/VR、三維視覺(jué)、模式識(shí)別等多個(gè)圖形圖像領(lǐng)域的學(xué)術(shù)論壇,合合信息自然語(yǔ)言算法研發(fā)總監(jiān)丁凱博士、合合信息圖像算法研發(fā)總監(jiān)郭豐俊博士受邀參與《OCR前沿技術(shù)與產(chǎn)業(yè)應(yīng)用》等論壇,同來(lái)自中科院、北京大學(xué)、華中科技大學(xué)、聯(lián)想研究院、騰訊優(yōu)圖實(shí)驗(yàn)室等頂尖學(xué)術(shù)機(jī)構(gòu)、高校與企業(yè)的研究人員們一道,分享OCR領(lǐng)域的前沿進(jìn)展及技術(shù)規(guī)?;瘧?yīng)用情況。

1898_html_72811a7bd7d4d54b

丁凱博士于CCIG學(xué)術(shù)論壇上分享智能圖像處理技術(shù)

丁凱博士認(rèn)為,盡管OCR技術(shù)已走過(guò)一個(gè)世紀(jì)的發(fā)展,現(xiàn)今仍存在文檔圖像質(zhì)量退化嚴(yán)重、文字檢測(cè)及版面分析困難、非限定條件文字識(shí)別率低、結(jié)構(gòu)化智能理解能力差等亟待解決的問(wèn)題。OCR技術(shù)的進(jìn)階之路上,文檔圖像質(zhì)量的增強(qiáng)是重要的研究方向,需克服頁(yè)面彎曲、陰影遮擋、摩爾紋、圖片模糊等現(xiàn)代文本圖像處理中常見的干擾狀況。通過(guò)引入AI(人工智能)技術(shù),合合信息智能文字識(shí)別及圖像處理技術(shù)能夠幫助各應(yīng)用領(lǐng)域簡(jiǎn)化下游文檔處理任務(wù),提升文字識(shí)別效率與準(zhǔn)確性。

以彎曲矯正為例,丁凱博士介紹了基于文本行線擬合和坐標(biāo)變換、基于文本行線優(yōu)化矯正的方法原理和優(yōu)缺點(diǎn),并提到合合信息采用的基于位移場(chǎng)網(wǎng)絡(luò)學(xué)習(xí)的方法的系統(tǒng)架構(gòu),可有效解決多種彎曲文檔圖像的矯正問(wèn)題。除此之外,在教育領(lǐng)域,合合信息“字跡擦除”技術(shù)融合了內(nèi)容切分、手寫字跡分離網(wǎng)絡(luò)、文檔質(zhì)量增強(qiáng)技術(shù),對(duì)復(fù)雜場(chǎng)景進(jìn)行準(zhǔn)確處理,實(shí)現(xiàn)作業(yè)及試卷筆記“一鍵擦除”。

“字跡擦除”功能演示:布滿字跡的試卷(左)與“擦除字跡”后的試卷(右)

另外一方面,文檔數(shù)字化流程的建立是加速企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵,也是技術(shù)落地中的痛點(diǎn)。為了更好地解決不同業(yè)務(wù)中存在的文檔版式繁雜、訓(xùn)練樣本匱乏、模型定制化調(diào)優(yōu)周期長(zhǎng)且效率低的問(wèn)題,合合信息推出了TextIn Studio智能文字識(shí)別訓(xùn)練平臺(tái),可將底層資源、數(shù)據(jù)、模型訓(xùn)練、集成部署和服務(wù)管理應(yīng)用多個(gè)模塊整合在一起,針對(duì)性解決各項(xiàng)問(wèn)題的同時(shí),建立業(yè)務(wù)流程之間的閉環(huán),實(shí)現(xiàn)模型自動(dòng)化訓(xùn)練和部署。

TextIn Studio生產(chǎn)出了大量不同場(chǎng)景的文檔數(shù)字化模型,涉及近百種文檔圖像預(yù)處理、文字識(shí)別與理解、文檔格式轉(zhuǎn)換等方面的服務(wù),較為全面地覆蓋了企業(yè)和個(gè)人工作生活相關(guān)的文檔類型。合合信息通過(guò)TextIn小程序發(fā)起了針對(duì)高校研究者群體需求發(fā)起的限時(shí)體驗(yàn)活動(dòng),即高校的老師和學(xué)生注冊(cè)并綁定帶有“edu”后綴的教育郵箱后,每人一年可免費(fèi)獲得100萬(wàn)次的OCR服務(wù)。“希望這個(gè)活動(dòng)能夠進(jìn)一步推動(dòng)OCR領(lǐng)域產(chǎn)業(yè)界和學(xué)術(shù)界的合作,支持開發(fā)者們以更低的門檻接觸到相關(guān)技術(shù),從而研發(fā)更多有價(jià)值的應(yīng)用,推動(dòng)領(lǐng)域更好地發(fā)展。”丁凱博士說(shuō)。

目前,合合信息相關(guān)智能文字識(shí)別及圖像處理技術(shù)已被應(yīng)用于公司旗下掃描全能王等C端APP中及行業(yè)解決方案中,輻射全球百余個(gè)國(guó)家和地區(qū)的億級(jí)用戶。據(jù)悉,“字跡擦除”功能已接入華為PixLab V1彩色噴墨多功能打印機(jī)。相關(guān)技術(shù)還在國(guó)際頂會(huì)ICPR、ICFHR等十余項(xiàng)競(jìng)賽中獲得冠軍,并于CVPR、AAAI、ACL、ACM MM等國(guó)際頂會(huì)上發(fā)表。

1898_html_24771ba1c985c9d2

合合信息參賽隊(duì)伍獲第三屆CSIG圖像圖形挑戰(zhàn)賽總決賽冠軍

大會(huì)還舉行了第三屆CSIG圖像圖形挑戰(zhàn)賽總決賽頒獎(jiǎng)儀式。CSIG圖像圖形挑戰(zhàn)賽旨在促進(jìn)我國(guó)圖像圖形技術(shù)及相關(guān)產(chǎn)業(yè)的發(fā)展和應(yīng)用,解決企業(yè)面臨的技術(shù)難題,幫助企業(yè)引入更多的優(yōu)秀人才。本次大賽吸引了來(lái)自高校、科研機(jī)構(gòu)、企業(yè)的上百支參賽隊(duì)伍參與。憑借在視覺(jué)關(guān)鍵信息理解層面的算法優(yōu)勢(shì)與多語(yǔ)言票據(jù)識(shí)別場(chǎng)景的實(shí)踐沉淀,合合信息與高校及企業(yè)生態(tài)伙伴組成的參賽隊(duì)伍繼獲得“中英文購(gòu)物小票信息理解賽道”單項(xiàng)冠軍后,通過(guò)終輪現(xiàn)場(chǎng)比拼,榮獲CSIG圖像圖形技術(shù)挑戰(zhàn)賽總冠軍。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
人工智能

相關(guān)文章

  • 世界人工智能大會(huì)(WAIC 2023)點(diǎn)燃魔都,博爾捷數(shù)字科技攜前沿技術(shù)產(chǎn)品亮相

    “投身自創(chuàng)見、創(chuàng)新,至創(chuàng)造、創(chuàng)想的“AI生成之路”,共同詮釋AI驅(qū)動(dòng)的高質(zhì)量發(fā)展,展望“智變”后的全新形態(tài),圍爐暢論光明的智能未來(lái)?!?023世界人工智能大會(huì)(簡(jiǎn)稱WAIC2023)于7月6日至7月8日在上海舉辦,本次大會(huì)由國(guó)家發(fā)展改革委、工業(yè)和信息化部、科學(xué)技術(shù)部、國(guó)家互聯(lián)網(wǎng)信息辦公室、中國(guó)科學(xué)院

    標(biāo)簽:
    人工智能
  • IoT開發(fā)者為王,涂鴉智能硬核“靠邊站”

    IoT盛宴:涂鴉向下,產(chǎn)品向上

    標(biāo)簽:
    人工智能
  • IPO觀察丨黑芝麻智能遞表港交所,車芯行業(yè)已邁向量產(chǎn)決戰(zhàn)期?

    雖然我國(guó)汽車芯片行業(yè)還處在發(fā)展初期,但已經(jīng)迸發(fā)出無(wú)限潛力。一方面,智能汽車的發(fā)展不斷帶動(dòng)需求增長(zhǎng);另一方面,政策引導(dǎo)下,汽車芯片企業(yè)持續(xù)搶占高地。對(duì)此,在7月5日-7日舉辦的2023年中國(guó)汽車論壇上,中國(guó)汽車工業(yè)協(xié)會(huì)副秘書長(zhǎng)李邵華就做出表示,“中國(guó)將成為未來(lái)汽車芯片發(fā)展的集聚地”。車規(guī)芯片行業(yè)近日的

    標(biāo)簽:
    人工智能
  • 倒計(jì)時(shí)2天丨云天勵(lì)飛將亮相世界人工智能大會(huì)

    2023世界人工智能大會(huì)將于7月6日至8日在上海舉辦。云天勵(lì)飛將在大會(huì)上展示自主設(shè)計(jì)開發(fā)的新一代邊緣計(jì)算芯片DeepEdge10系列SoC芯片,并公布“天書”大模型的最新動(dòng)態(tài)。歡迎蒞臨上海世博展覽館H1-C801展臺(tái)參觀交流!同時(shí),云天勵(lì)飛也將與中國(guó)電子、中國(guó)信通院、華為等合作伙伴,在WAIC的舞臺(tái)

    標(biāo)簽:
    人工智能
  • 酷學(xué)院智能產(chǎn)品發(fā)布會(huì):引領(lǐng)中大型企業(yè)學(xué)習(xí)新潮流

    近日,酷學(xué)院智能產(chǎn)品發(fā)布會(huì)在深圳閃亮登場(chǎng)。近200位現(xiàn)場(chǎng)觀眾和近萬(wàn)人次在線觀看,共同見證了這一激動(dòng)人心的時(shí)刻。發(fā)布會(huì)上,酷學(xué)院引領(lǐng)大家探索企業(yè)培訓(xùn)學(xué)習(xí)和人才發(fā)展領(lǐng)域的新高度,并揭幕其全新的產(chǎn)品智能升級(jí)和突破??釋W(xué)院產(chǎn)品負(fù)責(zé)人徐晨通過(guò)形象生動(dòng)、邏輯嚴(yán)謹(jǐn)?shù)闹v述,揭曉了全新的智能企業(yè)培訓(xùn)和人才發(fā)展平臺(tái),以

    標(biāo)簽:
    人工智能

熱門排行

信息推薦