Alessio Pomaro · @alessiopomaro
97 followers · 689 posts · Server mastodon.uno

🧠 Qwen-VL di Alibaba è un nuovo VLA (Vision-Language Model) in grado non solo di elaborare immagini e testo, ma anche di individuare e riquadrare oggetti nelle immagini.
💡 La è una caratteristica che fa sempre più parte dei modelli di grandi dimensioni. Quando rilascerà la funzionalità OpenAI con ?
🔗 Il progetto: github.com/QwenLM/Qwen-VL

#multimodalita #GPT4 #ai #LLM #intelligenzaartificiale

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
89 followers · 645 posts · Server mastodon.uno
Alessio Pomaro · @alessiopomaro
89 followers · 644 posts · Server mastodon.uno

🖼️ Modelli come , , ma anche riescono già ad elaborare testo e immagini in un unico contesto, ma fa uno step ulteriore con RT-2, aggiungendo a tutto questo le azioni di un robot.
🦾 Si tratta di modelli definiti (Vision-Language-Action). Come e prevedono i token successivi di un input grazie a un training molto ampio, questi sistemi prevedono le azioni che un robot dovrà eseguire.

linkedin.com/posts/alessiopoma

#clip #kosmos #GPT4 #google #deepmind #vla #LLM #vlm #multimodalita #robotica #rt2

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
87 followers · 591 posts · Server mastodon.uno

✨ In l'ultimo miglio del software potrà essere generato "on demand"? 
🧠 Qui si vede come da un archivio di immagini si può passare a uno slideshow con musica di sottofondo attraverso di .
💡 Nella chat che condivido sotto si può vedere tutta l'interazione e il che viene generato dal . Decompressione dello ZIP, "ragionamenti" dell'algoritmo, generazione del video con le dissolvenze, integrazione del file MP3.

#futuro #codeinterpreter #chatgpt #python #LLM #ai #GPT4 #multimodalita

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
85 followers · 587 posts · Server mastodon.uno

🧐 L'app Android di raggiunge 1 milione di download in un giorno. Sinceramente, per l'utilizzo che io concepisco di questi strumenti, la trovo poco utile, ma direi che l'interesse non sembra poi così sceso come si dice.

#chatgpt #ai #LLM #multimodalita #intelligenzaartificiale #GPT4 #openai

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
81 followers · 578 posts · Server mastodon.uno

🦾 Attraverso Code Interpreter è già possibile estrarre testo dalle immagini con , trasformandolo successivamente in qualunque output. Ad esempio l'ho fatto diventare una pagina FAQ di prodotto.
🧠 Inizialmente non riuscivo a scorgere il plus di avere ChatGPT come app sullo smartphone. Ma immagina la versione multimodale, con accesso al web e Code Interpreter collaudato.

#chatgpt #ai #LLM #intelligenzaartificiale #multimodalita

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
80 followers · 563 posts · Server mastodon.uno

👁️ Anche introduce la nell'interazione con l'assistente in .
🦾 Questo tipo di interazione l'abbiamo già visto con di , ma si aggiunge la conversazione 
🧠 Google, con , l'ha introdotto nell'ultimo rilascio e OpenAI lo farà presto con ().

 

#bing #multimodalita #chat #multisearch #google #bard #chatgpt #GPT4 #ai #intelligenzaartificiale #LLM

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
72 followers · 445 posts · Server mastodon.uno

🧠 e , PaLM-E di Google, e gli algoritmi generativi: le recenti evoluzioni della ricerca online e degli algoritmi di intelligenza artificiale dimostrano in maniera decisa che la sta diventando il presente e rappresenta il futuro dell’interazione uomo-macchina.
🦾 Tuttavia si potrà andare anche oltre.

ai4business.it/intelligenza-ar

#multisearch #mum #GPT4 #multimodalita #ai #intelligenzaartificiale #lens #palm

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
67 followers · 398 posts · Server mastodon.uno

🧠 La è di certo una caratteristica che troveremo ovunque negli algoritmi del , e ce lo dimostra.
💡 è un modello basato su che mira a democratizzare le funzionalità rivoluzionarie di GPT-4, dimostrando eccezionali capacità di generazione multimodale.
🦾 Nella chat si vede come descrive la mia immagine e genera una storia partendo da quello che "vede".

🔗 Il progetto: minigpt-4.github.io/

#multimodalita #futuro #GPT4 #minigpt4 #opensource #vicuna #ai #intelligenzaartificiale #LLM

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
67 followers · 394 posts · Server mastodon.uno

🧠 Greg Brockman racconta il di in un TED talk.
⚠️ Sarà un'app "tutto fare" e l'assistente virtuale dei nostri sogni? Non lo so, ma le nuove funzionalità sono straordinarie!

linkedin.com/posts/alessiopoma

#futuro #chatgpt #ai #GPT4 #LLM #intelligenzaartificiale #openai #dalle #multimodalita #texttoimage

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
67 followers · 380 posts · Server mastodon.uno

💡Tactile Diffusion è un progetto che sfrutta i modelli di diffusione per generare immagini tattili sintetiche.
🦾 Questo significa che in un prossimo una macchina, attraverso dei sensori, potrà avere a disposizione anche il tatto come input ().
⭐ Sono ricerche straordinarie, che ci ricordano che lo sviluppo dell', anche se comporta dei rischi, è davvero importante.
🔗 Lo studio: arxiv.org/abs/2304.01182

#futuro #multimodalita #ai #LLM #intelligenzaartificiale #machinelearning #ml

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
63 followers · 355 posts · Server mastodon.uno

🧠 Cos'è ? Quali scenari apre il nuovo modello di OpenAI? La quali scenari apre?
💡 Questo è molto altro, nel terzo episodio di "Futuro, Presente!" , dove raccontiamo questi concetti in modo semplice.  

---

youtu.be/fjxEVBf4ZZA

#GPT4 #multimodalita #podcast #ai #intelligenzaartificiale #WeMakeFuture #machinelearning #ml #chatgpt #futuro

Last updated 2 years ago

@franzmari livello pro! Ti invidio, muoversi ad deve essere proprio un piacere

#multimodalita #amsterdam

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
61 followers · 322 posts · Server mastodon.uno

🦾 La non è "qualcosa in più": consente agli algoritmi di aumentare la comprensione del mondo.

🔍 Google sta facendo altri test per passare a direttamente dalla SERP.

👁️ Con la possibilità, successivamente di usare

🔗 seroundtable.com/google-camera

#multimodalita #lens #multisearch #seo #search #ai #VisualSearch

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
61 followers · 318 posts · Server mastodon.uno

🧠 Durante la presentazione di , Brockman ha trasformato uno schizzo su un foglio di carta in una pagina web.
🦾 Sì, lo so, era molto semplice. Ma guardiamo le potenzialità, e non la semplice operazione!
💡 Se vogliamo che l' capisca il mondo come noi, il linguaggio da solo non è sufficiente.
☝️ La è il futuro della comunicazione uomo-macchina.

#GPT4 #ai #multimodalita #intelligenzaartificiale #LLM #machinelearning #ml

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
61 followers · 296 posts · Server mastodon.uno

🤔 Il rilascio di sarà davvero imminente? 

🧠 Questo lo scopriremo, ma la parte più interessante è relativa alla e al funzionamento dei modelli in tutte le lingue.

🦾 "i modelli di linguaggio sono una forza dirompente per le aziende".

---

heise.de/news/GPT-4-kommt-naec

#GPT4 #multimodalita #ai #intelligenzaartificiale #LLM

Last updated 2 years ago

Alessio Pomaro · @alessiopomaro
56 followers · 264 posts · Server mastodon.uno

🍔 La campagna che si vede nelle immagini è stata generata attraverso l'AI: v4 + . Le immagini degli hamburger le ho date come input all'algoritmo, aggiungendo il prompt testuale per le ambientazioni ().

#midjourney #gpt3 #multimodalita

Last updated 3 years ago

Alessio Pomaro · @alessiopomaro
51 followers · 195 posts · Server mastodon.uno

🧠 Dopo , arriva : un nuovo modello di che permette di generare musica partendo da un prompt testuale.
😯 L'algoritmo è multimodale, quindi anche in grado di trasformare una descrizione testuale e una melodia di base (es. canticchiata) in un audio strutturato.
🎧 Gli esempi sono a dir poco sbalorditivi.

🔗 MusicLM: google-research.github.io/sean
🔗 Un approfondimento: alessiopomaro.it/algoritmi-gen

#audioml #musiclm #google #ai #texttomusic #intelligenzaartificiale #multimodalita

Last updated 3 years ago

Alessio Pomaro · @alessiopomaro
42 followers · 127 posts · Server mastodon.uno

💡 "Un sistema addestrato solo sul linguaggio non si avvicinerà mai all'intelligenza umana, anche se viene addestrato da ora fino alla fine dell'universo".
👁️ Ecco perché tutti i sistemi vanno verso la : per dotare di "sensi" la macchina, per aumentare la sua comprensione del mondo.
👉 Da leggere il post: è scritto da due luminari in ambito di .

---

noemamag.com/ai-and-the-limits

#multimodalita #ai #intelligenzaartificiale #gpt3 #LLM

Last updated 3 years ago

Alessio Pomaro · @alessiopomaro
39 followers · 86 posts · Server mastodon.uno

👁️ Alcuni esperimenti di ricerca usando di .

🔎 Attraverso viene definito l'elemento visuale che può essere dettagliato con la componente testuale.

🔥 Parola d'ordine: .

 

#multisearch #google #lens #multimodalita #seo #search

Last updated 3 years ago