BLOOM: Yapay zekayı demokratikleştirmek için radikal yeni projenin içinde

[ad_1]

Ancak Meta’nın modeli yalnızca talep üzerine mevcuttur ve kullanımını araştırma amaçlarıyla sınırlayan bir lisansa sahiptir. Hugging Face bir adım daha ileri gider. bu toplantılar Geçen yıl boyunca yaptığı çalışmaların ayrıntıları kaydediliyor ve çevrimiçi olarak yükleniyor ve herkes modeli ücretsiz olarak indirebilir ve araştırma veya ticari uygulamalar oluşturmak için kullanabilir.

BigScience için büyük bir odak noktası, etik düşünceleri sonradan düşünülmüş gibi ele almak yerine başlangıcından itibaren modele yerleştirmekti. LLM’ler, interneti kazıyarak toplanan tonlarca veri üzerinde eğitilir. Bu sorunlu olabilir, çünkü bu veri kümeleri çok sayıda kişisel bilgi içerir ve genellikle tehlikeli önyargıları yansıtır. grup geliştirdi veri yönetişim yapıları özellikle hangi verilerin kullanıldığını ve kime ait olduğunu daha net hale getirmesi gereken LLM’ler için ve farklı kaynaklardan veri kümeleri Çevrimiçi olarak kolayca erişilemeyen dünyanın dört bir yanından.

Grup ayrıca yeni bir Sorumlu AI Lisansı, hizmet şartları sözleşmesi gibi bir şeydir. Kolluk kuvvetleri veya sağlık hizmetleri gibi yüksek riskli sektörlerde BLOOM’u kullanmaktan veya insanlara zarar vermek, aldatmak, sömürmek veya onların kimliğine bürünmek için caydırıcı olmak üzere tasarlanmıştır. Projede gönüllü olan ve lisansı birlikte oluşturan bir yapay zeka araştırmacısı olan Danish Contractor, lisansın yasalar yetişmeden önce kendi kendini düzenleyen LLM’lerde bir deney olduğunu söylüyor. Ama nihayetinde, kimsenin BLOOM’u kötüye kullanmasını engelleyen hiçbir şey yok.

Taslağı hazırlayan Hugging Face’in etik uzmanı Giada Pistilli, projenin en başından beri modelin geliştirilmesi için yol gösterici ilkeler olarak işleyen kendi etik yönergelerine sahip olduğunu söylüyor. BLOOM’un etik tüzüğü. Örneğin, farklı geçmişlere ve konumlara sahip gönüllüleri işe almaya, dışarıdan gelenlerin projenin bulgularını kolayca yeniden üretebilmelerini sağlamaya ve sonuçlarını açık bir şekilde yayınlamaya önem verdi.

hepsi gemide

Bu felsefe, BLOOM ile bugün mevcut olan diğer LLM’ler arasındaki büyük bir farka dönüşüyor: Modelin anlayabileceği çok sayıda insan dili. Fransızca, Vietnamca, Mandarin, Endonezyaca, Katalanca, 13 Hint dili (Hintçe gibi) ve 20 Afrika dili dahil olmak üzere 46 tanesini işleyebilir. Eğitim verilerinin %30’undan biraz fazlası İngilizce idi. Model ayrıca 13 programlama dilini de anlıyor.

Bu, İngilizcenin hakim olduğu büyük dil modelleri dünyasında oldukça sıra dışıdır. Bu, LLM’lerin internetten veri sıyırarak oluşturulduğu gerçeğinin bir başka sonucudur: İngilizce, çevrimiçi olarak en yaygın kullanılan dildir.

BLOOM’un bu durumu iyileştirebilmesinin nedeni, ekibin dünyanın dört bir yanından gönüllüleri, bu diller çevrimiçi olarak iyi temsil edilmese bile diğer dillerde uygun veri kümeleri oluşturmak için bir araya getirmesidir. Örneğin, Hugging Face stajyeri ve Masakhane’de bir araştırmacı olan Chris Emezue, Hugging Face’in Afrika dilleri konusunda modeli eğitmek için kullanılabilecek yerel makamlardan veya üniversitelerden gelen kayıtlar gibi veri kümelerini bulmaya çalışmak için Afrikalı AI araştırmacılarıyla atölye çalışmaları düzenlediğini söylüyor. , Afrika dilleri için doğal dil işleme üzerinde çalışan bir kuruluş.

[ad_2]
Kaynak : https://www.technologyreview.com/2022/07/12/1055817/inside-a-radical-new-project-to-democratize-ai/

Yorum yapın

SMM Panel PDF Kitap indir