💡 Czy AI pomoże osobom starszym?; Dużo dużych nowości z Google I/O; ElevenLabs z lektorem dla Twoich tekstów; Claude w końcu w Europie; OpenAI ogłasza partnerstwo z Redditem;

WokółAI 21.05.2024

May 21, 2024

Dzień po dniu dwie świetne prezentacje. W poniedziałek GPT-4o, we wtorek Project Astra. Dwie różne prezentacje, ale obie docelowo najciekawsze w ujęciu multimodalnej asysty człowieka przez AI.

Czyli mówiąc po ludzku: asystent, który widzi (i rozumie to co widzi), słyszy (i rozumie to co słyszy) i jes w stanie nam pomóc, w różnych sytuacjach.

Jednym z ciekawszych przykładów było to, gdy Astra wskazywała autorce nagrania, gdzie ta zostawiła swoje okulary. I to od razu nasuwa pomysł (i takie pomysły się licznie po prezentacjach pojawiały) wsparcia osób starszych. Przypominania im o rzeczach, pomagania im w znalezieniu czegoś, sprawdzaniu jak się czują i reagowaniu na to co się dzieje.

Wszystko pięknie, na pewno jest to ogromny potencjał, mam tylko jedno ALE.

Interfejs.

Mam wrażenie, że potrzebna tu jest jakaś rewolucja, a przynajmniej ewolucja w kierunku czegoś totalnie bezobsługowego, a jednocześnie będącego zawsze przy danej osobie. Bo mimo, że adopcja nowych technologii rośnie (podobno już 60% mieszkańców USA w wieku 65+ posiada smartfon - źródło), to no właśnie, nadal spora część jest wykluczona technologicznie, a (to tylko moja obserwacja) obsługa smartfona nie dla wszystkich jego posiadaczy w tym wieku jest czymś trywialnym.

Pomijając zgubienie go, zapomnienie o nim lub jego rozładowanie.

Może więc to jest przestrzeń, która wszelkiego rodzaju “inteligentne przypinki”, jak AI pin czy rabbit r1, mogą zagospodarować.

A może potrzebne jest coś jeszcze innego?

🚀 A co działo się #WokółAI w ostatnim tygodniu?

Google na konferencji I/O ogłosiło dużo ciekawych nowości z zakresu AI
Ilya Sutskever - jeden z założycieli OpenAI, który stał na czele “przerwotu pałacowego”, odchodzi z firmy
Claude jest w końcu dostępny w Europie
Eleven Labs prezentuje Audio Native - czyli możliwość nadania głosu naszemu dowolnemu tekstowi
Nowe funkcje w ChatGPT w obszarze analizy danych
OpenAI i Reddit nawiązują współpracę - społecznościowe treści serwisu wzbogacą modele GPT

📰 A do poczytania i posłuchania w ostatnim tygodniu:

Podcast: a16z + AI - rynek Generatywnej AI po 18 miesiącach od rozpoczęcia boomu

Zapraszam do lektury 😊

👉 Poleć ten newsletter swoim znajomym, nie pozwól by istotne informacje dotyczące AI ich ominęły 😉

🔥 NOWOŚCI W ŚWIECIE AI

🚀 Google I/O

Wszyscy na tę konferencję czekali i się nie zawiedli. Google ogłosiło multum nowości dotyczących AI. Pełny keynote możecie obejrzeć tu:

A jeśli chodzi o podsumowanie najciekawszych informacji, to:

Można zadać pytania (głosowo) o nasze zdjęcia, np. żeby jakieś konkretne znaleźć, a Gemini nam w tym pomoże
Google Workspace otrzyma wsparcie Gemini - użytkownicy pakietu biurowego Google uzyskają coś w stylu Copilota
Gemini 1.5 Flash - nowy, najnowszy i najszybszy model z rodziny Gemini
Project Astra - uniwersalny, multimodalny Asystent AI, zobaczcie prezentację, bo warto:

Imagen 3 - nowy model generowania obrazów
Veo - nowy model do tworzenia video na podstawie tekstu

Gemini Trip Planning jako przykład konkretnego użycia AI w planowaniu podróży i podczas niej
AI osadzone na urządzeniach - przykład użycia to ochrona przed wyłudzeniami telefonicznymi

https://io.google/2024/

🚪 Ilya Sutskever opuszcza OpenAI

Ilya Sutskever, współzałożyciel OpenAI, który stał na czele przerwotu pałacowego, który pozbawił kierownictwa nad firmą Sama Atlmana (na parę dni), ogłosił swoje odejście.

Na stanowisku Chief Sientist zastąpi go Jakub Pachocki, który dotychczas kierował rozwojem GPT-4 i jego następcy, a także badaniami i rozwojem w obszarze reinforced learning oraz optymalizacji uczenia głębokiego (deep learning).

https://www.theverge.com/2024/5/14/24156920/openai-chief-scientist-ilya-sutskever-leaves

🔥 Claude dostępny (w końcu) w Europie, a Anthropic zbiera kolejne finansowanie

Claude od Anthropic w końcu dostępny jest w Europie, dodatkowo oferuje wsparcie dla języków innych niż angielski, jak francuski, niemiecki, włoski i hiszpański.

Europejski dostęp obejmuje także API dla developerów.

Jednocześnie firma ogłosiła, że stara się pozyskać dalszy kapitał, dodatowy względem już pozyskanych 8 miliardów dolarów (z czego 7 pozyskano w ostatnim roku).

https://techcrunch.com/2024/05/13/anthropic-is-expanding-to-europe-and-raising-more-money/

🎙️ Eleven Labs prezentuje Audio Native

Audio Native tworzy automatyczny, osadzony odtwarzacz z dźwiękowym zapisem naszego artykułu, wpisu na blogu, newslettera itp. Prostota obsługi + poprawa dostępności treści w kilka kliknięć brzmi obiecująco (koszt minimalny to tier Creator, czyli 11$ miesięcznie).

https://elevenlabs.io/audio-native/

📈 ChatGPT dostaje nowe funkcje - lepsza analiza danych i dostęp do plików

OpenAI osgłosiło kilka większych aktualizacji swojego chatbota. Od teraz użytkownicy płatni mogą bezpośrednio dodawać chatbotowi do pracy plik iz swojego Google Drive lub Microsoft OneDrive.

Dodatkowo, chatbot uzyskał możliwość pracy z tabelami, oferując interaktywne widoki tabelaryczne, którymi można zarządzać i je zmieniać, wpływać na wizualizacje itp.

https://openai.com/index/improvements-to-data-analysis-in-chatgpt/

🤝 OpenAI x Reddit

Reddit i OpenAI ogłosiło partnerstwo, które ma na celu udostępnienie modelem GPT dostępu poprzez API do treści tworzonych przez użytkowników serwisu, w czasie rzeczywistym.

Z drugiej strony Reddit otrzyma między innymi silnik rekomendacyjny dla treści dostosowanych do preferencji użytkowników, oraz wsparte AI narzędzia do moderacji treści.

https://venturebeat.com/ai/openai-partners-with-reddit-to-integrate-unique-user-generated-content-into-chatgpt/

📰 DO POCZYTANIA I POSŁUCHANIA

🎧 a16z + AI - rynek Generatywnej AI po 18 miesiącach od rozpoczęcia boomu

Ciekawy odcinek podcastu AI + a16z o tym, jak rynek Gen AI wygląda obecnie i dlaczego to jest nadal bardzo płynna domena.

Piotr Michałowski

Discussion about this post