Google Asistan’ın Geleceği Yüzümüze Bakıyor


yıllardır biz komutlarımızın tıklanmadığı, yazılmadığı veya kaydırılmadığı, ancak söylendiği bir bilgisayar geleceği vaat edildi. Bu sözün içinde elbette kolaylık vardır; sesle bilgi işlem yalnızca eller serbest olmakla kalmayacak, aynı zamanda tamamen yardımcı olacak ve nadiren etkisiz olacaktır.

Bu tam olarak ortaya çıkmadı. Daha fazla akıllı telefon ve akıllı ev müşterisi cihazlarında yaşayan yapay zekayı tercih ettiğinden (veya bazı durumlarda yanlışlıkla “uyandırdığından”) son yıllarda sesli asistanların kullanımı arttı. Ancak çoğu kişiye bu asistanları ne kullandıklarını sorun. içinve ses kontrollü gelecek, hava durumu raporları ve akşam yemeği zamanlayıcılarıyla dolu, neredeyse ilkel geliyor. Bize sınırsız zeka sözü verildi; “Baby Shark”ı tekrar ettik.

Google, doğal dil işleme ve AI görevlerini yerine getirmek için tasarlanmış çiplerdeki gelişmelerin bir kombinasyonu nedeniyle ses hesaplamada yeni bir çağın eşiğinde olduğumuzu söylüyor. Google’ın Google Asistan başkanı Sissie Hsiao, bugün Mountain View, California’da düzenlediği yıllık I/O geliştirici konferansında, şirketin sanal asistan için uzun vadeli planının bir parçası olan yeni özellikleri vurguladı. Hsaio, vaat edilen tüm bu kolaylıkların artık gerçeğe daha yakın olduğunu söylüyor. I/O başlamadan önceki bir röportajda, işten eve giderken sesinizi kullanarak hızlı bir şekilde pizza sipariş etme örneğini “Hey, geçen Cuma gecesinden pizza sipariş et” gibi bir şey söyleyerek verdi. Asistan daha fazla konuşmaya başlıyor. Ve bu tıknaz uyandırma sözcükleri, yani “Hey, Google”, ses kontrolünün kilidini açmak için yüzünüzü kullanmaya istekli olmanız koşuluyla yavaş yavaş uzaklaşıyor.

Sissie Hsiao, Google Asistan ekibine liderlik ediyor.

Fotoğraf: Nicole Morrison

Gizlilik, fayda ve Google’ın para kazanma konusundaki son oyunu hakkında sorular soran, ses için iddialı bir vizyon. Ve bu özelliklerin tümü bugün veya tüm dillerde mevcut değildir. Hsaio, “uzun bir yolculuğun parçası olduklarını” söylüyor.

“Bu, insanların heyecan duyduğu ilk ses teknolojisi çağı değil. Hsiao, “İnsanların tekrar tekrar tekrarladığı bir dizi sesli sorguya uygun bir pazar bulduk” diyor. Ufukta çok daha karmaşık kullanım durumları var. “Üç, dört, beş yıl önce, bir bilgisayar bir insanla, insanın insan olduğunu düşündüğü şekilde konuşabilir miydi? Bunu nasıl yapabildiğini gösterme yeteneğimiz yoktu. Şimdi olabilir.”

Kesildi

Aynı dili konuşan iki kişinin birbirini her zaman anlayıp anlamadığı, muhtemelen teknoloji uzmanlarına değil, evlilik danışmanlarına sorulması gereken bir sorudur. Dilbilimsel olarak konuşursak, “ums”, garip duraklamalar ve sık kesintilerle bile, iki insan birbirini anlayabilir. Biz aktif dinleyiciler ve tercümanlarız. Bilgisayarlar, pek değil.

Hsiao, Google’ın amacının Asistan’ın insan konuşmasındaki bu kusurları daha iyi anlamasını ve daha akıcı yanıt vermesini sağlamak olduğunu söylüyor. “…Floransa’dan… yeni şarkıyı çal ve bir şey mi?” Hsiao gösterdi; Asistan onun Floransa ve Makine’yi kastettiğini biliyordu. Bu, bir geliştirici konferansında hızlı bir demoydu, ancak öncesinde konuşma ve dil modelleri üzerine yıllarca süren araştırmaların yapıldığı bir demoydu. Google, konuşma işlemenin bir kısmını cihazda yaparak zaten konuşma iyileştirmeleri yapmıştı; şimdi de büyük dil modeli algoritmaları kullanıyor.

Büyük dil öğrenme modelleri veya LLM’ler, teknolojinin daha insani etkileşimleri tanımasını, işlemesini ve bunlara dahil olmasını sağlayan dev metin tabanlı veri kümeleri üzerine kurulu makine öğrenimi modelleridir. Google, bu konuda çalışan tek varlık değil. Belki de en iyi bilinen LLM, OpenAI’nin GPT3’ü ve onun kardeş görüntü oluşturucusu DALL-E’dir. Ve Google kısa süre önce şunları paylaştı: son derece teknik bir blog yazısı, şirketin “çok adımlı aritmetik veya sağduyulu akıl yürütme gerektiren” bilgi işlem görevlerinde atılımlar gerçekleştirdiğini iddia ettiği PaLM veya Pathways Language Model için planlarını içeriyor. Pixel veya akıllı ev ekranınızdaki Google Asistanınız henüz bu akıllı özelliklere sahip değil, ancak Turing testini uçan renklerle geçen bir geleceğe bir bakış.


Kaynak : https://www.wired.com/story/google-assistant-natural-language-sissie-hsiao

Yorum yapın