💡 Czy głosowe AI to ratunek czy przekleństwo?; Copilot+ PC; Google z rozwiązaniami AI dla edukacji; Scarlett Johannson broni "swojego" głosu przed OpenAI

WokółAI 28.05.2024

May 28, 2024

Nie lubię dzwonić. Wolę pisać. Wolę rezerwować przez formularze na stronach, systemy rezerwacji, Booksy, itp. Nie lubię słuchać muzyczki “relaksującej”, nie lubię być przełączany pomiędzy konsultantami.

A Ty?

Jeśli masz podobnie, to mam dla Ciebie dobrą informację: rozwój głosowych asystentów, jak Astra od Google czy GPT-4o od OpenAI może docelowo zdjąć ten ciężar z naszych głów. I co ciekawe jest szansa, że wydarzy się to szybciej niż możliwość samooobsługowego załatwienia wielu spraw w firmach czy urzędach.

Mam też dla Ciebie złą informację: to na pewno zwiększy liczbę męczących nas przysłowiowych telefonów o fotowoltaikę. I pewnie zwiększy ilość wyłudzeń (sprawdź podcast o Birmie na dole).

To jak to w końcu będzie? AI nas uratuje czy nam zaszkodzi?

🚀 A co działo się #WokółAI w ostatnim tygodniu?

Microsoft zaprezentował kategorię komputerów domowych zintegrowanych z AI
Google pokazało rozwiązania i model dla edukacji, który ma uczynić naukę efektywną, spersonalizowaną i angażującą
Scarlett Johansson w konflikcie z OpenAI, o głos
OpenAI zawiązało partnerstwo z News Corp, właścicielem takich tytułów, jak choćby Wall Street Journal
Meta pokazała swój nowy, natywnie multimodalny model - Chameleon

📰 A do poczytania i posłuchania w ostatnim tygodniu:

Jak modele “czytają” dane? - artykuł w Quanta Magazine przybliżający to zagadnienie
Centrum oszustw w Birmie i rola AI w nim - podcast Dział Zagraniczny opowiada o stosowaniu technologii deep fake przez oszustów

Zapraszam do lektury 😊

👉 Poleć ten newsletter swoim znajomym, nie pozwól by istotne informacje dotyczące AI ich ominęły 😉

🔥 NOWOŚCI W ŚWIECIE AI

💻 Copilot+ PC - przyszłość komputerów stacjonarnych?

Microsoft zaprezentował nową kategorię komputerów personalnych nazwaną Copilot+ PC, której główną cechą ma być jak najmocniejsza integracja z możliwościami Generatywnej AI.

Główne cechy, które zostały na ten moment zapowiedziane:

Recall - do poszukiwania informacji na naszym “laptopie”
Cocreator - tworzenie za pomocą AI grafik
Live Captions - tłumaczenie audio z ponad 40 języków, na ten moment tylko na język angielski

Każdy Copilot+ PC będzie posiadał, jak nazwa wskazuje, Copilota, który będzie wzbudzany pojedynczym klawiszem Copilota. Oparty o najnowsze modele od partnerów Microsoftu, w tym GPT-4o, będzie w pełni zintegrowany ze środowiskiem pracy użytkownika.

https://blogs.microsoft.com/blog/2024/05/20/introducing-copilot-pcs/

👨‍🏫 LearnLM - AI w służbie edukacji

Google zaprezentowało LearnLM, nowy model AI, dedykowany sektorowi edukacyjnemu. Jego głównym celem jest budowa bardziej angażujących oraz spersonalizowanych doświadczeń w obszarze nauczania.

Model ma funckjonować w wielu produktach Google, rozszerzając je o warstwę AI dla edukacji. Przykłoadowo w wynikach wyszukiwania zaserwuje bardziej dopasowane i intuicyjne wyjaśnienia złożonych zagadnień, a w YouTube pozwoli na interakcję z edukacyjnymi video (np. poprzez zadanie pytań do jego fragmentu, który dla kursanta może być niejasny).

Poza samym modelem firma zaprezentowałą dwa nowe narzędzia:

Illuminate zamienia publikacje naukowe w krótkie materiały audio, gdzie w formie dialogu dwóch głosów wygenerowanych przez AI, dostajemy dostęp do podsumowań i głównych wniosków.

Learn About to z kolei coś w rodzaju wyszukiwarki dla edukacji, gdzie po zadaniu pytania otrzymamy kompleksową informację w multimedialnym formacie (tekst, obraz, video), dostosowaną do naszego poziomu wiedzy, do któej dodatkowo możemy zadać pogłębiające lub wyjaśniające pytania.

https://blog.google/outreach-initiatives/education/google-learnlm-gemini-generative-ai/

👩‍🎤 Scarlett Johansson przeciw OpenAI. Poszło o głos.

Scarlett Johansson uważa, że OpenAI użyło jej głosu, aby zasilić nim swój najnowszy chatbot GPT-4o, którego głos Sky brzmi podobnie do głosu aktorki. Oczywiście gwiazda nie wyraziła na to zgody.

OpenAI twierdzi, że głos użyty w rozwiązaniu nie miał na celu naśladować głosu Scarlett Johansson i został wybrany jeszcze zanim firma skontaktowała się z nią oficjalnie (w celu nabycia praw do wykorzystania jej głosu), a należy do innej aktorki (której prywatność firma, jak twierdzi, chce chronić).

OpenAI mimo to, wyłączyła głos Sky ze swojego rozwiązania, a aktorka zapowiada podjęcie kroków prawnych, mających na celu wyjaśnienie źródła pochodzenia głosu chatbota.

https://www.nbcnews.com/tech/tech-news/scarlett-johansson-shocked-angered-openai-voice-rcna153180

https://openai.com/index/how-the-voices-for-chatgpt-were-chosen/

📰 Kolejne partnerstwo OpenAI z mediami - tym razem News Corp

OpenAI i News Corp ogłosiło wieloletnie, globalne partnerstwo. Umożliwi ono twócom ChatuGPT korzystanie z aktualnych i archiwalnych treści, wliczając w to takie media, jak: The Wall Street Journal, The Times, The Australian.

News Corp z kolei ma stać na straży zapewnienia wysokich standardó dziennikarskich w produktach OpenAI, aby połączenie tradycyjnych mediów i nowoczesnej technologii było jak najbardziej wartościowe, jakościowe i dostępne dla użytkowników.

https://openai.com/index/news-corp-and-openai-sign-landmark-multi-year-global-partnership/

🦎 Meta i jej multimodalny Kameleon

Meta zaprezentowała swój natywnie multimodalny model Chamaleon, który dzięki zastosowaniu nowoczesnej architektury, opisywanej jako "early-fusion token-based mixed-modal" (co ją wyróżnia to brak wyspecjalizowanych komponentów dla konkretnego rodzaju treści), pokazuje bardzo wysokie wyniki w testach jeśli chodzi o odpowiadanie na pytania oparte na obrazie i opisywanie tego co “widzi”.

https://venturebeat.com/ai/meta-introduces-chameleon-a-state-of-the-art-multimodal-model/

📰 DO POCZYTANIA I POSŁUCHANIA

🎧 Birma, oszustwa i AI

Maciej Okraszewski w swoim podcaście - Dział Zagraniczny - pochyla się nad kwestią centrum oszustw znajdującego się w Birmie, a także tego, jak tamtejsi oszuści używają AI w swoim procederze.

📰 Jak modele “czytają”?

Artykuł Quanta Magazine stara się przybliżyć ostatnie wyniki badań w tym obszarze.

https://www.quantamagazine.org/how-do-machines-grok-data-20240412

Piotr Michałowski

Discussion about this post