Fişlerin Taranması Beklenenden Daha Zor Olduğunu Kanıtlıyor


Kulağa kesinlikle yeterince basit gelen şeylerden biri: Bir makbuzun fotoğrafını çekin, optik karakter tanıma (OCR) ile çalıştırın ve elde edilen bilgileri, istediğiniz gider izleme web sitesine veya yazılıma gönderin. Zaten böyle bir hizmet sunan şirketler var, bu yüzden kendi başınıza kopyalamak çok zor olamaz… değil mi?

işte bu [Marcel Robitaille] homebrew “Makbuz Alımı” sistemini oluşturmaya başladığında düşündü, her neyse. Ancak gerçekte, sorunları gidermek ve uygulamak o kadar uzun sürdü ki, tüm makbuzlarını elle girmenin daha hızlı olacağını söyledi. Yine de buna bağlı kaldığı için mutluyuz, aksi takdirde Hackaday’da bu konuda okumazdınız ve sağladığı ayrıntılı hesaptan hiçbir şey öğrenemezdik.

Kaba bir demoyu bir araya getirmek sadece bir akşam sürdü ve ilk sonuçlar çok umut vericiydi. Kod, makbuzun kenarlarını algılayabilir, yakalanan görüntüyü uygun şekilde döndürebilir ve ardından tarih, toplam tutar, işletme adı vb. gibi kritik bilgileri çıkarabilir. Ardından, çevrimiçi bir hizmet olan Splitwise için API’yi deşifre edebildi. yeni bir fatura eklerken tarayıcısı tarafından gönderilen verileri yakalayarak faturaları bölme. Bu bilgilerle, yakalanan verilerini hizmete göndermek için bazı Python kodları yazmak önemsizdi. Çok uzak çok iyi.

Referans noktası olarak bir QR kodu kullanma.

Ama mutlu bir ailenin güzel bir evde yeni bir hayata başlamasıyla başlayan pek çok korku filmi gibi, gölgelerde gizlenen bir canavar vardı. Kusursuz temiz ve düz makbuzlardan veri toplamak bir şeydir, ancak günün yarısını arka cebinizde buruşmuş bir şekilde harcayan herhangi bir yararlı bilgiyi almak başka bir şeydir. Kontrollü koşullar altında bir tedaviyi çalıştıran umut verici konsept kanıtı, gerçek dünyada tamamen başarısız oldu. [Marcel] taramaya çalıştığı 5 makbuzdan yalnızca 1’inin gerçekten geçtiğini bildiriyor.

Sonunda, [Marcel] fişlerin güvenilmez durumuyla baş etmenin en iyi yolunun görüntüdeki farklı bir nesneye odaklanmak olduğunu fark etti. Taranacak makbuzla masaya koyabileceği ve yazılımının bilinen bir referans noktası olarak kullanabileceği bir QR kod işaretçisi buldu. Bu, görüntü döndürme ve dönüştürmenin güvenilirliğini büyük ölçüde artırır ve bu da OCR’yi daha güvenilir hale getirir. Ayrıca hangi görüntülerin taranması gerektiğini söylemeyi çok daha kolay hale getirir – QR kodu bulunmazsa, yazılım o çekimi atlar ve aramaya devam eder.

OCR kullanarak büyük miktarda basılı içeriği dijitalleştirmenin benzersiz zorlukları, bazı büyüleyici problem çözme sağlar ve biz memnunuz [Marcel] bu özel hikayeyi bizimle paylaştı. Hala takip edilmesi gereken bazı uç durumlar olsa da, yazılımı neredeyse her gün kullanıyor ve GitHub’da yayınladı çabalarını geliştirmek isteyebilecek herkes için.


Kaynak : https://hackaday.com/2022/04/21/scanning-receipts-proves-trickier-than-anticipated/

Yorum yapın