掃描儀正日漸失去重要性,智能手機及其專用應(yīng)用程序正逐漸取而代之,成為桌面設(shè)備的有效替代選擇。對于不同規(guī)模的企業(yè)而言,利用移動掃描來實現(xiàn)流程自動化更加經(jīng)濟實惠,甚至小型組織也能承擔得起。當然,您可以僅僅通過智能手機的相機拍攝來獲取副本,但這樣得到的只會是一張帶有背景的照片。
掃描儀應(yīng)用程序
在這種情境下,最理想的解決方案是利用人工智能技術(shù)的移動掃描應(yīng)用程序。為什么掃描質(zhì)量如此關(guān)鍵呢?即便在復雜的環(huán)境下,人工智能也能有效識別文檔的邊界并實現(xiàn)高質(zhì)量的掃描。用戶通常不會考慮那些可能影響掃描效果的因素,比如透視失真、光線、顏色及背景紋理等。通過網(wǎng)絡(luò)的支持,我們能夠解決這些挑戰(zhàn)。這使得用戶可以在僅僅2秒鐘內(nèi)完成自動掃描,而不是手動選擇文檔所需的5到6秒以上的時間。
目前面臨的挑戰(zhàn)以及對該領(lǐng)域的期望
在應(yīng)用程序中實現(xiàn)網(wǎng)絡(luò)的主要挑戰(zhàn)是資源。先進的算法通常需要高昂的計算能力,而移動設(shè)備有時甚至無法支持這些算法的加載。針對這一問題,可以考慮兩種解決方案:
在云端運行業(yè)務(wù),并通過互聯(lián)網(wǎng)向用戶提供結(jié)果。
使用專為移動設(shè)備設(shè)計的網(wǎng)絡(luò),并直接在設(shè)備上進行操作。
第一個解決方案成本更高,因為應(yīng)用程序發(fā)布者需要租用服務(wù)器。此外,它只能在互聯(lián)網(wǎng)可用時使用。然而,這種方案使我們能夠為用戶提供最先進且資源消耗最少的算法,無論硬件條件如何。
關(guān)于第二種解決方案,我們需要考慮與我們應(yīng)用程序兼容的最老舊設(shè)備,并開發(fā)能夠與這些設(shè)備一起使用的專用網(wǎng)絡(luò)。
這些方案并不是最理想的選擇。如果您需要盡可能高的準確性,或者算法消耗的資源過多,首選方案就是最佳選擇。如果您希望得到一個運行穩(wěn)定且不依賴互聯(lián)網(wǎng)連接的解決方案,可以考慮第二種方案。此外,您還可以將這兩種方案結(jié)合起來,比如在設(shè)備上運行一部分網(wǎng)絡(luò),同時在云端運行另一部分。
在不久的將來,我們的手機將變得更加強大,深度學習的研究人員會設(shè)計出更高效的網(wǎng)絡(luò)架構(gòu),這將使我們能夠在移動設(shè)備上運行該領(lǐng)域一些頂尖的算法。此外,我們還將能夠利用最先進的云GPU,并通過5G技術(shù)將結(jié)果及時傳遞給用戶。這一切都將帶來無與倫比的用戶體驗。
移動應(yīng)用對網(wǎng)絡(luò)技術(shù)的市場需求有哪些?
對于中小型企業(yè)而言,提升效率與降低成本依然是最重要的任務(wù),而且這一趨勢逐年上升。對文檔、支票和收據(jù)進行快速掃描的需求依然存在,但我們并不總能隨身攜帶平板掃描儀。此外,進行無缺陷的高質(zhì)量掃描也是至關(guān)重要的,這對基于訓練有素的網(wǎng)絡(luò)的移動掃描儀來說是相對簡單的任務(wù)。
在大流行期間,隨著人們離開設(shè)備齊全的辦公環(huán)境,遠程工作中使用文件的問題變得尤為突出。因此,一款能夠幫助企業(yè)家高效組織遠程工作的移動應(yīng)用程序,能夠在幾次點擊內(nèi)發(fā)送高質(zhì)量文檔,對用戶而言具有顯著的價值。
人工智能掃描移動應(yīng)用不僅僅是企業(yè)家使用的。這類應(yīng)用的目標用戶涵蓋了各個行業(yè)的不同人群:
在旅途中的工作者(如記者、醫(yī)療人員、銷售員)
學生不僅要掃描文檔,還需要在手機上快速編輯,然后通過信使將其發(fā)送給老師。
學校教師與大學教授
在自有網(wǎng)絡(luò)上運行的移動應(yīng)用程序有什么特別之處?
應(yīng)用程序面臨的最大挑戰(zhàn)之一是明確用戶希望掃描的內(nèi)容。這一過程始于對圖像中文檔的正文和邊框的識別。許多掃描應(yīng)用程序在自動檢測邊界時往往不夠準確,并且常常出現(xiàn)各種錯誤。例如,確定表格的起始點和文檔的結(jié)束位置是一項復雜的任務(wù)。尤其是在紙張放置在白色桌子或一堆文件上時,問題就會變得更加棘手。此時,人工智能技術(shù)能發(fā)揮重要作用。
為了幫助您了解如何在掃描應(yīng)用中實現(xiàn)人工智能,請關(guān)注我們的iScanner應(yīng)用,它在獨立網(wǎng)絡(luò)上運行。人工智能的引入使得處理復雜掃描場景成為可能,例如受損的文件、低光照條件下拍攝的圖片、透視失真、框架內(nèi)多份文件以及主文件與其他物體的重疊等問題。最有趣也是最具挑戰(zhàn)性的部分是,通常一張圖片可能同時包含以上幾種或全部因素。在將網(wǎng)絡(luò)技術(shù)應(yīng)用于iScanner后,文檔邊界的識別準確率從62%提升至97%。目前,該應(yīng)用的數(shù)據(jù)集中,有超過97.3%的文檔發(fā)現(xiàn)了肉眼無法識別的錯誤。
如今,人們對利用手機在幾秒鐘內(nèi)獲取高質(zhì)量掃描文檔的需求已經(jīng)成為現(xiàn)實。因此,應(yīng)用程序開發(fā)者不僅需要關(guān)注提升掃描質(zhì)量,還要考慮添加人工智能的附加功能,因為將掃描應(yīng)用程序轉(zhuǎn)變?yōu)槎喙δ芷脚_的趨勢愈加明顯。