OpenAI wydało GPT-4, wielomodalną sztuczną inteligencję
Blog

OpenAI wydało GPT-4, wielomodalną sztuczną inteligencję

OpenAI ma ogłosił wydanie zaawansowanego modelu sztucznej inteligencji o nazwie GPT-4, który dzięki ulepszonemu algorytmowi wykazuje wyjątkowe zdolności rozumienia zarówno obrazów, jak i tekstu uczenie maszynoweTa innowacja stanowi ważny kamień milowy w drodze firmy do udoskonalenia technologii głębokiego uczenia się.

Dostęp do GPT-4 jest możliwy za pomocą OpenAI ChatGPT Subskrybenci podlegają limitom użytkowania, natomiast deweloperzy mogą zapisać się na listę oczekujących, aby uzyskać dostęp do interfejsu API.

Struktura cenowa obejmuje opłatę w wysokości 0.03 USD za każde 1,000 tokenów „prompt” (co odpowiada około 750 słowom) i 0.06 USD za każde 1,000 tokenów „completion” (ponownie, około 750 słów). Tokeny są podstawowymi elementami tekstu; na przykład słowo „fantastic” można by podzielić na tokeny „fan”, „tas” i „tic”. Tokeny prompt składają się z segmentów słów wprowadzonych do GPT-4, podczas gdy tokeny complete odnoszą się do treści wygenerowanej przez model AI.

Co ciekawe, GPT-4 działał dyskretnie, jak ujawniły Potwierdzenie Microsoftu że Bing Chat, technologia chatbotów opracowana wspólnie z OpenAI, opiera się na GPT-4.

Wcześni użytkownicy GPT-4

Wielu wczesnych użytkowników już wykorzystuje potencjał GPT-4. Stripe wykorzystuje model AI do analizowania stron internetowych firm i dostarczania podsumowań zespołom obsługi klienta. Duolingo zintegrowało GPT-4 z nowym poziomem subskrypcji nauki języków.

Morgan Stanley opracowuje system oparty na GPT-4 do wyodrębniania informacji z dokumentów korporacyjnych dla analityków finansowych. Ponadto Khan Academy wykorzystuje GPT-4 do tworzenia zautomatyzowanego rozwiązania do korepetycji.

GPT-4 wykazał się niezwykłą wydajnością w różnych profesjonalnych i akademickich testach porównawczych, osiągając wyniki na „ludzkim poziomie”. Na przykład w symulowanym egzaminie adwokackim GPT-4 uzyskał wynik najlepsze 10% zdających testy, co stanowi znaczną poprawę w porównaniu do 3.5% najgorszych wyników GPT-10.

Pół roku rozwoju

OpenAI spędziło sześć miesięcy na dostrajaniu GPT-4, korzystając z wniosków z wewnętrznego programu testowania przeciwników i ChatGPT. Rezultatem jest model, który charakteryzuje się niezrównaną dokładnością, sterownością i zdolnością do działania w ramach wstępnie zdefiniowanych ograniczeń.

Aby wytrenować GPT-4, OpenAI współpracowało z Microsoft aby utworzyć niestandardowy „superkomputer” w chmurze Azure. Model został wytrenowany przy użyciu publicznie dostępnych danych i licencjonowanych źródeł danych, co zaowocowało wszechstronnym i wszechstronnym modelem języka.

GTP-4 potrafi rozumieć obrazy tak samo jak tekst

Jednym z najbardziej intrygujących aspektów GPT-4 jest jego zdolność do zrozumieć obrazy oprócz tekstu. Na przykład może rozpoznawać i interpretować stosunkowo złożone obrazy, takie jak identyfikacja adaptera Lightning Cable na podstawie obrazu podłączonego iPhone'a.

Chociaż funkcja rozumienia obrazu nie jest jeszcze dostępna dla wszystkich klientów OpenAI, jest ona testowana na Bądź moimi oczami, pojedynczy partner. Funkcja Virtual Volunteer firmy Be My Eyes, obsługiwana przez GPT-4, może odpowiadać na pytania dotyczące obrazów, które są do niej wysyłane. W poście na blogu firma wyjaśniła, jak działa ta funkcja:

„Jeśli użytkownik wyśle ​​zdjęcie wnętrza swojej lodówki, Wirtualny Wolontariusz nie tylko będzie w stanie poprawnie zidentyfikować, co się w niej znajduje, ale także ekstrapolować i analizować, co można przygotować z tych składników. Narzędzie może również zaoferować szereg przepisów na te składniki i wysłać przewodnik krok po kroku, jak je przygotować”.

Funkcja „Narzędzia sterowalności”

Nowa funkcja „narzędzia sterowalności” pozwala programistom na przepisywanie szczegółowe instrukcje do AI, aby ustalić ton i granice dla jej interakcji. Ta funkcja jest możliwa dzięki wprowadzeniu nowej możliwości API zwanej komunikatami „systemowymi”.

Wiadomości systemowe to w zasadzie instrukcje, które dostarczają styl i zadanie, które AI musi wykonać. Są jak wytyczne, które dyktują, jak AI powinna zachowywać się w danej sytuacji. ChatGPT również otrzyma tę funkcję w przyszłości.

Na przykład komunikat systemowy może określać, że AI powinna działać jak nauczyciel, który zawsze odpowiada w stylu Sokratesa. W takim przypadku AI nigdy nie udzieliłaby uczniowi odpowiedzi bezpośrednio, ale zawsze zadałaby właściwe pytania, aby pomóc mu nauczyć się myśleć samodzielnie.

ZWIĄZANE Z: 12 zastosowań AI w edukacji

Ponadto sztuczna inteligencja zawsze dostosowywałaby pytania do zainteresowań i wiedzy ucznia, rozbijając złożone problemy na prostsze części, aż do osiągnięcia odpowiedniego poziomu.

Pomimo wprowadzenia komunikatów systemowych i innych ulepszeń, OpenAI uznaje, że GPT-4 nadal ma wady. AI nadal może popełniać błędy w rozumowaniu, a nawet „halucynować” fakty. Na przykład GPT-4 kiedyś opisał Elvisa Presleya jako „syna aktora”, co jest niepoprawne.

Jakie są ograniczenia GPT-4

Według OpenAI, GPT-4 cierpi na brak wiedzy o ostatnich wydarzeniach, które miały miejsce po wrześniu 2021 r., kiedy to jego dane się kończą. Ponadto GPT-4 nie uczy się na podstawie doświadczeń, co czasami może skutkować prostymi błędami rozumowania, które nie odzwierciedlają jego szerokiej wiedzy w wielu dziedzinach.

Co więcej, algorytm GPT-4 może być zbyt ufny w kwestii akceptowania ewidentnie fałszywych oświadczeń użytkowników i może nawet zawodzić w trudnych zadaniach, takich jak wprowadzanie luk w zabezpieczeniach do generowanego kodu.

Ostatnie słowa

Pomimo tych ograniczeń OpenAI twierdzi, że GPT-4 wprowadził znaczące ulepszenia w niektórych obszarach. Na przykład GPT-4 jest teraz mniej skłonny do generowania instrukcji dotyczących syntezy niebezpiecznych chemikaliów. W porównaniu do GPT-3.5, GPT-4 jest o 82% mniej skłonny do odpowiadania na żądania dotyczące „niedozwolonej” treści.

 

Co więcej, GPT-4 jest teraz bardziej zgodny z polityką OpenAI w zakresie udostępniania poufnych informacji, takich jak porady medyczne i tematy dotyczące samookaleczenia, na które odpowiada o 29% częściej niż w przypadku swojego poprzednika.

 

Jaka jest twoja reakcja?

Podekscytowany
0
Szczęśliwy
0
Miłość
0
Niepewny
0
Głupi
0
Emily Davis
Emily jest inżynierem uczenia maszynowego. Zajmuje się wykorzystywaniem AI, aby wywierać pozytywny wpływ na świat. Kiedy nie pracuje, lubi czytać i wypróbowywać nowe przepisy w kuchni.

Produkty które mogą Ci się spodobać:

Więcej w:Blog