百度文本識別服務提供定制模板識別功能,現在想要實現,可能是什么技術解決方案。如何根據模板參考點調整圖片
看看百度自定義模板的指南,至少需要定義四個參考點。我猜應該是基于N根據每張新圖片,至少可以檢測到四個參考點來校正視角到統一坐標。
自定義模板文字識別指南
從左到右點擊工具欄中的第三個小圖標參考點框選擇工具進行參考點框選擇。參考點必須是模板圖片上的文本段。選框時有一些注意事項:醫??颖?/p>
同一參考點的文本必須在同一行中,盡可能相鄰;參考點必須是模板圖片和后來上傳的圖片中常見且不變的文本段;參考點應盡可能分散在圖片的邊緣,特別是四個角落;參考點應盡可能分散在模板圖片上,多次出現在圖片中的文本段效果較差;參考點應盡可能多。建議標記8個以上的參考點,至少4個。參考點越多,識別效果越分散;以下是參考點框選擇的示例。橙色矩形框選擇為參考點:醫療保險卡樣本
我是這個產品工程部分的程序員,我想我有資格回答這個問題。
樓上@piaolin答案基本正確,但不完整。整個調整過程包括許多步驟,如醫療保險卡樣本
1、參考字段的匹配。有不同的匹配策略,盡可能匹配圖片上的參考字段和模板上選擇的參考字段
2、參考字段過濾。雖然在制作模板時需要盡可能選擇唯一的參考字段,但實際上很難滿足這一條件,因此也需要一定的過濾算法來消除錯誤的參考字段
3、計算透視投影矩陣。從過濾后的參考字段中選擇合適的點坐標,將待識別圖轉換為模板底圖的統一坐標系
4、結構化識別結果。根據識別區域的矩形框組合和拼接識別結果。這里更麻煩的是表列劃分、行劃分和折疊問題。由于表區域不需要水平劃分,因此在非剛性變形的情況下,很容易出現錯誤的行。折疊問題更為明顯,因為我不知道哪些行可能是一個字段,所以這一點也結合了一些圖片信息來幫助處理。幸運的是,這些問題目前并不明顯??梢栽诤罄m使用EM算法來解決
除上述四個步驟外,還有許多其他細節,如計算匹配程度、待識別圖像預處理、透視投影與仿射轉換、蒙板處理等
基于行業領先的圖像處理和文本識別技術,提供模板識別和圖像分類器的自定義功能,整合各種預設能力,提供多場景解決方案,自動分類固定版本的高效、低成本的卡票和全場景結構化識別
1.卡證、文件電子化
對未提供特殊界面但布局相對統一的各種卡、文件,如海外身份證(英文)、結婚證、產權證書、房地產證書、門票實現各種卡、文件的電子化,可應用于紙質文件分類歸檔、信息統計分析、關鍵內容提取等場景,有效降低勞動力輸入成本,大大提高信息管理效率
2.財務票據識別
模板制作各種發票、收據、銀行對賬單、承兌匯票等常用財務賬單,實現自動分類和結構化識別。并預常用發票模板可直接使用,可應用于企業財務報銷、會計、記錄等場景,有效降低企業勞動力成本,控制業務風險
3.醫療票據識別
模板制作檢驗報告、門診收費、住院收費等常用醫療票據,實現自動分類和結構化識別,可應用于醫療數據分析、醫療費用報銷、醫療賬單電子場景,實現相關賬單信息的自動識別和輸入,有效降低勞動力成本,大大提高醫療信息化程度
1.云端服務
云端提供各種文本識別Paas用戶可以直接調用服務接口API或使用SDK識別圖片中的文本
2.私有化部署
部署到客戶本地服務器,實現客戶內網的文本識別功能,保證數據隱私,提供兩種私有化方案:一體機和軟件部署包
1.全場景適配
支持制作任何固定版卡證、票據的模板,實現結構化識別,廣泛的應用場景
2.操作簡單
1張模板圖片,5分鐘即可完成模板定制,結合自定義分類器一步實現圖片的自動分類及結構化識別
3.服務穩定
依托百度云技術實力,提供高可靠性、靈活性、高并發性的文本識別服務,服務可用性高達99.99%
畢業證樣本網創作《醫??颖?如何實現百度文字識別服務中的自定義模板識別)》發布不易,請尊重! 轉轉請注明出處:http://www.fangrui88.com.cn/177707.html