
რთულ გარემოში ადამიანებს შეუძლიათ გააცნობიერონ მეტყველების მნიშვნელობა, ვიდრე AI, რადგან ჩვენ ვიყენებთ არა მხოლოდ ჩვენს ყურებს, არამედ ჩვენს თვალებსაც.
მაგალითად, ჩვენ ვხედავთ, რომ ვინმეს პირი მოძრაობს და შეიძლება ინტუიციურად ვიცოდეთ, რომ ხმა, რომელსაც ჩვენ გვესმის, უნდა მოვიდეს ამ ადამიანისგან.
Meta AI მუშაობს AI დიალოგის ახალ სისტემაზე, რომელიც ასწავლის AI- ს, ასევე ისწავლოს დახვეწილი კორელაციების ამოცნობა, რასაც ხედავს და ისმენს საუბარში.
VisualVoice გაიგებს მსგავსი გზით, თუ როგორ სწავლობენ ადამიანები ახალი უნარების დაუფლებას, აუდიო-ვიზუალური მეტყველების განცალკევების შესაძლებლობას, ვიზუალური და აუდიტორული მითითებების სწავლებით არ გამოირჩევიან ვიდეოებისგან.
მანქანებისთვის, ეს ქმნის უკეთეს აღქმას, ხოლო ადამიანის აღქმა აუმჯობესებს.
წარმოიდგინეთ, რომ შეძლებთ ჯგუფურ შეხვედრებში მონაწილეობას Metaverse– ში მთელი მსოფლიოს კოლეგებთან, მცირე ჯგუფურ შეხვედრებზე, რადგან ისინი ვირტუალურ სივრცეში გადადიან, რომლის დროსაც ხმის ხმის მიცემა და სცენაზე ხმის მიცემა ხდება გარემოზე შესაბამისად.
ანუ მას შეუძლია ერთდროულად მიიღოს აუდიო, ვიდეო და ტექსტური ინფორმაცია და აქვს უფრო მდიდარი გარემოსდაცვითი გაგების მოდელი, რაც მომხმარებლებს საშუალებას აძლევს ჰქონდეთ "ძალიან wow" ხმის გამოცდილება.
პოსტის დრო: ივლისი -20-2022