Autor xprop | Zheng Yue, kern kern bearbeiten xprop | Zheng Xuan
Es überrascht mich nicht, dass google Von openschützen abgeschossen wurde.
Nach einer serie Von smogbomben hat OpenAI gestern mit AI die welt durch einen AI, der die reale welt sehen, hören und ohne verzögerung sprechen kann, geschockt. Am tag vor dem kongress Von google
Bei einer google-eins-o-kongressansprache um 10 uhr ortszeit, einem tag nach dem anderen, Und während google eine reihe Von "AI fasses" auf Gemini veröffentlicht hat, die an Gemini 1,5 Pro, darunter einen zweistelligen zusammenhang mit tokens Pro, und ein neues modell, Gemini 1,5 1,5 Pro, und ein großes videomodell für jeden film-flash und jeden Sora, kann es für jeden gewinner gewinner sein. Auch mit vielen al -anwendungen, wie AI + Gmail, erkannt.
Aber die größten sorgen machen die mitarbeiter Von google DeepMind und demiabis führungskräfte, die wirklich zu AGI gehen das "Project Astra". Und an Gemini Advanced abonnenten die mit der sicherstellung der sicherstellung der telefongespräche beauftragt sind soll also in den nächsten jahren mit der kameras beauftragt werden, um mit der mit der sicherstellung der authentischen umgebung des jeweils diensthabenden kontakt zu führen.
Beide produkte sind ein wenig so etwas wie GPT / 40, aber unabhängig Von den tatsächlichen ergebnissen haben wir es geschafft, die produktion zu optimieren. Es beweist aber dennoch nicht, dass OpenAI zu den sieger zählt. Das handy ist bis jetzt das wichtigste hardwarewerkzeug für alle superintelligenten assistenten, und google hat einen natürlichen vorteil, das android-system zu kontrollieren. Es ist möglich, dass das, was in der vergangenen zeit Von apples zusammenarbeit mit OpenAI bekannt geworden ist, dem kampf gegen google entstammt und nur dem, was man braucht.
In jedem fall aber hat sich ein brillanter assistent Von "demografen der realen welt" mit "niedrigem transkript" und "niedrigem jet" zur bestimmung des nächsten wettrüstes der unternehmen entwickelt. Es werden weitere große modellunternehmen, cloud computing-plattformen, selbst die handy-unternehmen, sowie die entwickler Von apps beteiligt sein.
1.project Astra in echtzeit ein video, das schwören würde, nicht gelogen zu haben
Bei der ein /O sitzung hat google ein erstaunliches video mit AI assistent gesendet und dieses mal schwört er, dass er es nicht in irgendeiner weise verfälscht Oder gefälscht habe.
Project Astra es videos xprop | : google
Demiabis verspricht, dass die welt der AI, die es seit jahrzehnten hält, die zukunft Von warte auf warte.
Das Project Astra ist ein in echtzeit sehr stilvoller assistent der ki, der mit der umgebung korresponsiert, indem er informationen erhält, sich an die punkte erinnert, die es ist, die leistungen verbessert und details des kontakts entwickelt, eine sprachinteraktion ist natürlicher, keine verzögerung Oder verzögerung, als die aktuelle version Von ingen in anwesenheit Von Astra. Sie kann fragen beantworten Oder dir helfen, fast alles zu tun.
Auf dem video bittet die nutzer Astra, ihr zu sagen, dass sie etwas, das ein komisches ereignis hervorruft, erwartet. Die assistentin antwortet, es könnte eine sprechanlage haben.
Interaktion wird in echtzeit ermöglicht und es gibt keine "hey, Google, Gemini". Die nutzer fragten "wie der auf dem bildschirm enthaltene code", und die bezeichnung wurde nicht aufgeschoben.
Project Astra., brille xprop | der google
Die art und weise, wie Astra ein astronomie-astra verließ, ist sogar die größte aussicht auf die sportveranstaltung. "Weißt du noch, wo ich meine augen gemacht habe?" "Deine brille ist auf dem tisch neben dem roten apfel." Die bezeichnung, die ein kleines vasenförmiges schrein ist, wird sogar durch die kamera auf Astra übertragen. Es könnte eine art "privater Astra" eingesteckt sein, die auf der brille vielleicht auch ein kleines Astra hat.
Bei der demonstration kann die nachricht, die die beteiligen, schnell Astra in die hand nehmen. Diese art kann durch wiederholte videoaufnahmen und die kombination Von videos mit einer zeitlinie gespeichert werden. Die daten wird gespeichert, um die erinnerung aufrecht zu erhalten. Google hat angedeutet, dass einige dieser funktionen später in diesem jahr der Gemini -anwendung und anderen produkten hinzugefügt werden.
Project Astra nenne band für die goldene streifen xprop | der google
Google vermutet, dass das DeepMind team weiter an der frage arbeitet, wie man am besten modelliermodelle integriert und supergroße allgemeine modelle mit kleineren, zenturieren modellen ausbalanciert.
Es scheint, als hätten sich gestern die großen durchbrüche Von openal, kurz nach aufruf Von GPT / 40 o, wiederholt. Die größte ausnahme ist ein typ, der mittels Astra ein statisches Astra behandeln kann.
Die großen "mini" -modelle, die auf Astra aussehen, sind aber auch aktualisiert worden. James ~ ay ~ 100 millionen zugriffe auf eine ~ Gemini 1,5 Pro, mit originalen audio - und systemvorgaben und jsin-folgen folgen letzten monat auf der Google Cloud Next 2024.
Und die ankündigung, dass ein Gemini 1,5 Flash immer ein entscheidendes kostenproblem aktiviert wurde. Und Flash Gemini 1,5 kann zwischen Gemini 1,5 und Gemini 1,5 mal ein gewinner sein. Und die preiswerte für Gemini 1,5 Pro und Flash wurden bei diesem meeting ausführlich beschrieben. Und der preis für Gemini 1,5 Flash ist für jeden 100.000 token-tag 35 cent, immer noch viel billiger als für jeden jeden 1000-dollar-token-tag 1 0-40.
Gemini 1,5 b. macromedia Flash xprop | der geek park
Dann hat google prophezeit, dass es im weiteren verlauf dieses jahres das bestehende kontextfenster auf zwei millionen tokens verdoppeln würde. So kann er zwei stunden video, 22 stunden audio, mehr als 60.000 codezeilen Oder mehr als 1,4 millionen wörter gleichzeitig verarbeiten.
Gemini 1,5 Pro xprop | der geek park
Eine Von google im dezember veröffentlichte präsentation einer voraufnahme wurde als "gefälscht" in frage gestellt. Damit wurden die berechtigungskapazitäten Von Gemini durch schnitt in die irre geführt und nun sind sie real.
02. Fortschritte im bereich der AI -anwendungen auf der grundlage großer modelle
Auch auf dem ein /O kongress hat google das design der al -anwendungen auf der grundlage großer modelle erweitert. Es greift auf alle facetten der suche, der fotografien, der entwicklung, der werkzeuge und der arbeitsthemen zu.
Suche war das genesis material Von google vor 25 jahren. Vor einem jahr sagte google, die suche nach der zukunft sei AI. Das habe ich verstanden, aber es steht fest: "lass google dir helfen, google zu googeln."
Google-chef Sundar Pichai gab auf dem I/ o-kongress bekannt, dass ein auf künstlicher intelligenz generiertes suchprogramm, das heute als "meeting über künstliche intelligenz" bekannt ist, "in dieser woche für alle in den usa, in weiteren ländern und regionen verfügbar sein wird."
Das thema ist AI, er kann sehr viel kompliziertere probleme lösen. Google gab dazu ein beispiel für die suche nach einem neuen yoga-atelier, das sowohl an einem ort beliebt als auch bequem zur arbeit zur verfügung stehen soll und für das es billiger sein könnte, nur eine durchsuchung durchzuführen.
Zusätzlich können die nutzer die erstellten zusammenfassungen ändern, Oder sie können eine gekürzte version auswählen Oder weitere details anzeigen.
Alles funktioniert mit einem speziellen Gemini modell, das komplexe denkprozesse, planung und models mit suchsystemen kombiniert, online-inhalte zusammenfassen und antworten aufzeigen soll, wie es AI behauptet, die seiten zu entwickeln und zu füllen.
Aber eine frage ist, wenn AI die suchergebnisse für die nutzer einsammelt, wohin geht dann das werbungsgeschäft Von google?
Die links in AI zusammenfassungen werden laut google-vorständen verstärkt aufgerufen, im vergleich zu traditionellen webseiten, die abgefragt wurden. "Wie immer wird werbung auch weiterhin auf der seitenseite stehen und sie wird durch klare etiketten Von organischem feedback unterscheiden."
Neben fragen kann google AI auch pläne für den umzug Von der ernährung zur reiseroute entwickeln, wie etwa "einen leicht wartenden drei-tage-ernährungsplan erstellen". Das AI fertigt die planung an, und die nutzer können ein Essen vegetarisch verwerten, das dann in ein dokument Oder eine google-e-mail exportieren.
Die suche ist nicht nur text im textrahmen, sondern auch die visuelle suche Von google hat sich so entwickelt, dass sie mit videofragen fragen stellen kann. Der benutzer hat beispielsweise einen gebrauchten cd-player, in dem metallteile mit fäden herumdrifteten und nicht Wissen, wie sie das problem Trennen sollen, und kann deshalb einfach ein videosuchprogramm Laufen, das gleichzeitig zeit und schwierigkeiten vermeidet, die zur beschreibung des problems nötig sind.
Mit,, direkt zur ernährungsplan xprop | der google
Und die apps Von google fotografie werden sich weiter entwickeln. Sandar pichai führt sein demo vor neun jahren auf, in dem nun täglich mehr als sechs milliarden fotos und videos hochgeladen werden.
Das in den kommenden monaten auf den markt zu bringen wird "Ask Photos", das auf dem Gemini modell basiert, das es den nutzern ermöglicht, in natürlicher sprache nach menschen und in Photos, haustichen Oder ähnlichen zu suchen, den kontext und den inhalt der Photos zu erfassen, ausgewählte informationen zu präsentieren ohne dabei den bildschirm zu bewegen.
Nicht nur "zeige mir die schönsten bilder aller nationalparks, die ich je gesehen habe", "wo habe ich letztes jahr gezeltet?" "Wann ist mein gutschein fällig?" "Seit wann hat Lucia schwimmen gelernt?" "Lucia macht beim schwimmen fortschritte." "was ist das thema Von lina?" Und schließlich liefern sie ansprechende und persönliche schlagzeilen, die sie in den sozialen medien teilen können.
Das Google fügte hinzu: "außer in seltenen fällen, in denen es um missbrauch Oder beschädigung geht, werden wir diese persönlichen daten nicht dazu verwenden, auch andere Gemini modelle und produkte mit photoshop zu trainieren."
Fragen fotos, gefragt geburtstagsparty details xprop | der google
Bei der I/O generalversammlung brachte google auch die ausrüstung für die erzeugung Von videos der al videogestaltung die videoausrüstung videof.f.x. auf die aktualisieren der al F.F.X. bilder und musik-varianten.
Die filmexf.f.x. kann die filmexploads ad f.x. programmieren, und imagex. ergänzt die bildbearbeitung, und die anderen musixxes gibt ein neues xf.modell.
Das neue werkzeug videof.x. wurde durch Veo drive bereitgestellt und Veo ist das stärkste generierte videomodell Von google DeepMind. Das neue werkzeug wird mit einem geschichten-modus versehen, um es einzeln zu durchspielen und dem endvideo musik hinzuzufügen.
Nach angaben Von google-führungskräften kann Veo terminal-shootings (" weitblick shooting ") nachvollziehen, das videomaterial mit einer länge Von bis zu einer minute in einer vielzahl verschiedener film - und visueller formen produziert. Veo bietet eine vorschau auf die warteliste an.
Außerdem sollte erwähnt werden, dass alle aspekte der videof.x., imagex. und musixx mit der digitalen filmmuxe SynthID gekennzeichnet Waren, die hauptsächlich darauf abzielen, den missbrauch Von inhalten und die verbreitung falscher informationen zu verhindern.
Mit, die neue VideoFX xprop | der google
Neben den werkzeugen, verdient auch die evolution Von apps zu googles routinearbeit aufmerksamkeit. Google-space apps wie gmail-mail, kalender, dokumente, formulare, folien, folien, candleon-festplatten und so weiter werden das neueste modell der AI 1,5 Pro, das neben der seitenleiste als virtuelle assistenten eingesetzt wird, eingefügt.
Wenn benutzer auf das spek-modul im seitenfeld klicken, wird in Gmail das Gemini fragen wie "zusammenfassung dieser e-mail", "liste nächster schritte" und "fehlermeldungen" eingeben Damit kann man eine e-mail Von der schule schreiben, sich informationen darüber aneignen und antworten erarbeiten.
Gmail auf. In Gemini lässt e-mail xprop | der google
Aber es ist ein ghut-4o demo, das gestern Von OpenAI herausgegeben wurde, das eine bildungspyzene enthält, die ein kind in der routine der geometrie lehrt.
Ebenfalls verkündete google leschnauze, ein auf Gemini basisiertes drehmodell, das für ausbildungszwecke gedacht ist und ebenfalls bildszenen der al education images auf der suche und in der youtube-anwendung vorführt.
Auf YouTube können nutzer beispielsweise fragen stellen, wenn sie ein video anschauen Oder weitere fragen stellen. Wo du auf circleto Search zugreift, versucht Circle Search herauszufinden, welche besonderen schwierigkeiten es bei mathe und physik gibt.
Gegen YouTube lernen video fragen über xprop | der google
Ein wichtiger vorteil bei der entwicklung Von AI ist, dass google mit OpenAI gleichgeht, nämlich mit seinem handy android und mit seinem riesigen hybrid-know-how.
Aber ist es wirklich wahr, dass, wenn er wirklich in google-öko-apps eingebaut wird, die suche übernimmt, erinnerungen nachhilft, reiseroute erstellt und an die stelle der authentischen gerüste tritt? Wird diese neuntklässler da sein?
* kennengelernt: der intelligenteste typ
Eine weitere story im geekpark. Hier findet man den artikel über the cekparkgo des gecinns
SSN: die oben aufgeführten inhalte (einschließlich bilder und videos) werden Von der media-plattform "netz" hochgeladen und ausgegeben, es gibt nur einen informationsspeicherdienst
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.