FYP - 毕业设计 - 演示 文字稿

2020-11-16  本文已影响0人  zoeqing

part1簡介: 今天帶來的是一款食物過敏原添加劑查詢軟件。
/我會帶一些不同顏色對比度的食物包裝/

可以從這些食品包裝看出來,字體很小且難以辨識,添加劑和過敏原標註的不是很詳細。因此我們製作了一款手機軟件,通過掃描條形碼和食物標籤來分析食物成份,給用戶健康建議。下面是我們的在惠康拍的一段演示視頻。

Part2演示:
首先展示的是條形碼掃描,我們用到了open food fact的數據庫,包括來自134個國家,超過50,000 種包裝食品。用戶可以在此瀏覽食品的詳細資料,還有營養成份條形圖。

假設這個食品不在我們條形碼數據庫裡,我們提供一種光學文字辨識的方法,用戶可以直接掃描文字,我們會通過掃描結果給出健康意見。如果用戶發現有遺漏的地方可以通過手動輸入添加完整。

Part3我們用到的技術:
市面上條形碼掃描器總共有兩種,ZXing和ZBar,如果使用ZXing那麼用戶需要多下載一個軟件。為了整合條形碼掃描器在我們的軟件裡,我們採取了比較舊在2009年10月27日推出的ZBar。

剛才視頻裡提到過的光學文字辨識,廣泛應用於紙質數據錄入,在銀行,海關等等都有廣泛的應用。與傳統的OCR相比,我們面臨的難題在於:第一,食品包裝的顏色非常多樣;第二,食品包裝除了紙質還有塑料及各種。
現有的OCR並不能滿足這些需求,因此我們需要通過新的圖像處理技術來提高準確度。我們採取了TesseractOCR engines。這個圖形識別引擎,在支援線下掃描的同時,支援OpenCV圖形處理公式。

我們在進行OCR掃描的時,你可以看到一些紅色方框框住文字,這是借MSER技術,模糊非文字的圖片信息提升掃描速度。

通過更好圖形處理算法,再加上文字拆散重構,與過敏原相似度比較的方法,目前能夠達到準確度在80%左右。

下面我說一下我們是如何提升準確度的。
首先是圖片處理,在比較和研究之後,我們發現,顏色和對比度對掃描結果影響最大。黑白會比彩色結果更佳,中等對比度比高對比度結果更佳。因此我們採取了圖片灰階化和降低對比度的方法。

其次就是文字的拆散和重構,
whitelist:?

wordlist:我們自己寫了文字近似比較的算法。可以參照右圖這裡例子,假設讀取到的詞語字母顛倒,或者只讀到了前面一部分。我們會match到近似的食物詞組。為保證OCR錄入的結果是食物成份,我們會將每一個詞語都會和我們的食物詞與字典做近似比較。

training:安裝更多的字體,使OCR可以認更多的包裝;(格式/材質可以訓練嗎??)

thresholding:??

Part4改進:

  1. 把OCR進程搬到服務器上,提升OCR速度
  2. 假若經條形碼掃描,該產品不在我們的數據庫,自動錄入產品信息。
    This is the end.
上一篇下一篇

猜你喜欢

热点阅读