İnsanlar için yeni bir yapay zeka vizyonu


Ancak çok az kişi, sesi manuel olarak kopyalamak için dile yeterince hakimdi. Siri gibi sesli asistanlardan ilham alan Mahelona, ​​doğal dil işlemeyi araştırmaya başladı. Jones, “Bilgisayara Maori dilini öğretmek kesinlikle gerekli hale geldi” diyor.

Ancak Te Hiku bir tavuk-yumurta sorunuyla karşı karşıya kaldı. inşa etmek tekrar konuşma tanıma modeli, çok sayıda kopyalanmış sese ihtiyaç duyuyordu. Sesi kopyalamak için, ilk etapta küçük sayılarını telafi etmeye çalıştığı gelişmiş hoparlörlere ihtiyacı vardı. Bununla birlikte, okuyabilen çok sayıda başlangıç ​​ve orta düzey konuşmacı vardı. tekrar kelimeleri bir kayıtta tanıyabileceklerinden daha iyi yüksek sesle.

Bu yüzden Jones ve Mahelona, ​​Te Hiku COO’su Suzanne Duncan ile birlikte akıllı bir çözüm geliştirdiler: mevcut sesi kopyalamak yerine, insanlardan, dildeki tüm sesleri yakalamak için tasarlanmış bir dizi cümleyi okurken kendilerini kaydetmelerini isteyeceklerdi. Bir algoritmaya göre, elde edilen veri seti aynı işlevi görecektir. Bu binlerce çift sözlü ve yazılı cümleden tanımayı öğrenecekti. tekrar sesli heceler.

Takım bir yarışma ilan etti. Jones, Mahelona ve Duncan bulabildikleri her Maori topluluk grubuyla temasa geçtiler. kapa haka dans grupları ve waka ama kano yarışları ekiplerine katıldı ve hangisinin en çok kaydı gönderenin 5.000 dolarlık büyük ödül kazanacağını açıkladı.

Tüm topluluk seferber oldu. Rekabet kızıştı. Bir Maori topluluğu üyesi olan Te Mihinga Komene, bir eğitimci ve dijital teknolojileri yeniden canlandırmak için kullanmanın savunucusu tekrartek başına 4.000 cümle kaydetti.

Tek motivasyon kaynağı para değildi. İnsanlar Te Hiku’nun vizyonunu benimsedi ve verilerini korumak için ona güvendi. “Te Hiku Media, ‘Bize ne verirseniz, biz buradayız. kaitiaki [guardians]. Biz ilgileniyoruz, ancak ses hâlâ size ait,” diyor Te Mihinga. “Bu önemli. Bu değerler, Māori olarak kim olduğumuzu tanımlar.”

10 gün içinde Te Hiku, yaklaşık 2.500 kişi tarafından yapılan yaklaşık 200.000 kayıttan 310 saatlik konuşma metni çiftleri topladı; bu, AI topluluğundaki araştırmacılar arasında duyulmamış bir katılım düzeyi. Projeyi sosyal medyadan öğrendikten sonra projeye katılan Māori veri bilimcisi Caleb Moses, “Bunu bir Māori organizasyonu dışında kimse yapamazdı” diyor.

Veri miktarı, genellikle İngilizce dil modellerini eğitmek için kullanılan binlerce saate kıyasla hala küçüktü, ancak başlamak için yeterliydi. Mozilla Vakfı’ndan mevcut bir açık kaynak modelini önyüklemek için verileri kullanan Te Hiku, ilk modelini yarattı. tekrar %86 doğrulukla konuşma tanıma modeli.


Kaynak : https://www.technologyreview.com/2022/04/22/1050394/artificial-intelligence-for-the-people/

Yorum yapın