SeamlessM4T. Meta випустила ШІ-модель, що може транскрибувати та перекладати близько 100 мов
Голова компанії Марк Цукерберг каже, що відкрита екосистема ШІ працює на користь Meta, оскільки компанія може виграти більше від ефективного краудсорсингу створення інструментів, орієнтованих на споживача, для своїх соціальних платформ, ніж від стягнення плати за доступ до моделей.
SeamlessM4T є спадкоємцем моделі машинного перекладу No Language Left Behind від компанії Meta, а також Universal Speech Translator, однієї з небагатьох систем прямого перекладу, що підтримує мову хоккієн (один з діалектів китайської). Модель побудована на основі Massively Multilingual Speech, фреймворку Meta, що забезпечує розпізнавання, ідентифікацію та синтез мовлення для більш ніж 1100 мов.
Під час розробки моделі Meta зібрала загальнодоступний текст (порядку «десятків мільярдів» речень) і мову (4 мільйони годин) з інтернету.