🧠 Qwen-VL di Alibaba è un nuovo VLA (Vision-Language Model) in grado non solo di elaborare immagini e testo, ma anche di individuare e riquadrare oggetti nelle immagini.
💡 La #multimodalità è una caratteristica che fa sempre più parte dei modelli di grandi dimensioni. Quando rilascerà la funzionalità OpenAI con #GPT4?
🔗 Il progetto: https://github.com/QwenLM/Qwen-VL
#multimodalita #GPT4 #ai #LLM #intelligenzaartificiale
🖼️ Modelli come #CLIP, #Kosmos, ma anche #GPT4 riescono già ad elaborare testo e immagini in un unico contesto, ma #Google #Deepmind fa uno step ulteriore con RT-2, aggiungendo a tutto questo le azioni di un robot.
🦾 Si tratta di modelli definiti #VLA (Vision-Language-Action). Come #LLM e #VLM prevedono i token successivi di un input grazie a un training molto ampio, questi sistemi prevedono le azioni che un robot dovrà eseguire.
https://www.linkedin.com/posts/alessiopomaro_ai-llm-chatgpt-activity-7098187603341930496-70Se
#clip #kosmos #GPT4 #google #deepmind #vla #LLM #vlm #multimodalita #robotica #rt2
✨ In #futuro l'ultimo miglio del software potrà essere generato "on demand"?
🧠 Qui si vede come da un archivio di immagini si può passare a uno slideshow con musica di sottofondo attraverso #CodeInterpreter di #ChatGPT.
💡 Nella chat che condivido sotto si può vedere tutta l'interazione e il #Python che viene generato dal #LLM. Decompressione dello ZIP, "ragionamenti" dell'algoritmo, generazione del video con le dissolvenze, integrazione del file MP3.
#futuro #codeinterpreter #chatgpt #python #LLM #ai #GPT4 #multimodalita
🧐 L'app Android di #ChatGPT raggiunge 1 milione di download in un giorno. Sinceramente, per l'utilizzo che io concepisco di questi strumenti, la trovo poco utile, ma direi che l'interesse non sembra poi così sceso come si dice.
#AI #LLM #multimodalità #IntelligenzaArtificiale #GPT4 #OpenAI
#chatgpt #ai #LLM #multimodalita #intelligenzaartificiale #GPT4 #openai
🦾 Attraverso Code Interpreter è già possibile estrarre testo dalle immagini con #ChatGPT, trasformandolo successivamente in qualunque output. Ad esempio l'ho fatto diventare una pagina FAQ di prodotto.
🧠 Inizialmente non riuscivo a scorgere il plus di avere ChatGPT come app sullo smartphone. Ma immagina la versione multimodale, con accesso al web e Code Interpreter collaudato.
#chatgpt #ai #LLM #intelligenzaartificiale #multimodalita
👁️ Anche #Bing introduce la #multimodalità nell'interazione con l'assistente in #chat.
🦾 Questo tipo di interazione l'abbiamo già visto con #Multisearch di #Google, ma si aggiunge la conversazione
🧠 Google, con #Bard, l'ha introdotto nell'ultimo rilascio e OpenAI lo farà presto con #ChatGPT (#GPT4).
#bing #multimodalita #chat #multisearch #google #bard #chatgpt #GPT4 #ai #intelligenzaartificiale #LLM
🧠 #Multisearch e #MUM, PaLM-E di Google, #GPT4 e gli algoritmi generativi: le recenti evoluzioni della ricerca online e degli algoritmi di intelligenza artificiale dimostrano in maniera decisa che la #multimodalità sta diventando il presente e rappresenta il futuro dell’interazione uomo-macchina.
🦾 Tuttavia si potrà andare anche oltre.
#multisearch #mum #GPT4 #multimodalita #ai #intelligenzaartificiale #lens #palm
🧠 La #multimodalità è di certo una caratteristica che troveremo ovunque negli algoritmi del #futuro, e #GPT4 ce lo dimostra.
💡 #MiniGPT4 è un modello #opensource basato su #Vicuna che mira a democratizzare le funzionalità rivoluzionarie di GPT-4, dimostrando eccezionali capacità di generazione multimodale.
🦾 Nella chat si vede come descrive la mia immagine e genera una storia partendo da quello che "vede".
🔗 Il progetto: https://minigpt-4.github.io/
#multimodalita #futuro #GPT4 #minigpt4 #opensource #vicuna #ai #intelligenzaartificiale #LLM
🧠 Greg Brockman racconta il #futuro di #ChatGPT in un TED talk.
⚠️ Sarà un'app "tutto fare" e l'assistente virtuale dei nostri sogni? Non lo so, ma le nuove funzionalità sono straordinarie!
#AI #GPT4 #LLM #IntelligenzaArtificiale #OpenAI #Dalle #multimodalità #TextToImage
#futuro #chatgpt #ai #GPT4 #LLM #intelligenzaartificiale #openai #dalle #multimodalita #texttoimage
💡Tactile Diffusion è un progetto che sfrutta i modelli di diffusione per generare immagini tattili sintetiche.
🦾 Questo significa che in un prossimo #futuro una macchina, attraverso dei sensori, potrà avere a disposizione anche il tatto come input (#multimodalità).
⭐ Sono ricerche straordinarie, che ci ricordano che lo sviluppo dell'#AI, anche se comporta dei rischi, è davvero importante.
🔗 Lo studio: https://arxiv.org/abs/2304.01182
#futuro #multimodalita #ai #LLM #intelligenzaartificiale #machinelearning #ml
🧠 Cos'è #GPT4? Quali scenari apre il nuovo modello di OpenAI? La #multimodalità quali scenari apre?
💡 Questo è molto altro, nel terzo episodio di "Futuro, Presente!" #podcast, dove raccontiamo questi concetti in modo semplice.
#AI #IntelligenzaArtificiale #WeMakeFuture #MachineLearning #ML #ChatGPT #futuro
---
#GPT4 #multimodalita #podcast #ai #intelligenzaartificiale #WeMakeFuture #machinelearning #ml #chatgpt #futuro
@franzmari #multimodalità livello pro! Ti invidio, muoversi ad #Amsterdam deve essere proprio un piacere
🦾 La #Multimodalità non è "qualcosa in più": consente agli algoritmi di aumentare la comprensione del mondo.
🔍 Google sta facendo altri test per passare a #Lens direttamente dalla SERP.
👁️ Con la possibilità, successivamente di usare #Multisearch.
🔗 https://www.seroundtable.com/google-camera-search-promo-35053.html
#multimodalita #lens #multisearch #seo #search #ai #VisualSearch
🧠 Durante la presentazione di #GPT4, Brockman ha trasformato uno schizzo su un foglio di carta in una pagina web.
🦾 Sì, lo so, era molto semplice. Ma guardiamo le potenzialità, e non la semplice operazione!
💡 Se vogliamo che l'#AI capisca il mondo come noi, il linguaggio da solo non è sufficiente.
☝️ La #multimodalità è il futuro della comunicazione uomo-macchina.
#GPT4 #ai #multimodalita #intelligenzaartificiale #LLM #machinelearning #ml
🤔 Il rilascio di #GPT4 sarà davvero imminente?
🧠 Questo lo scopriremo, ma la parte più interessante è relativa alla #multimodalità e al funzionamento dei modelli in tutte le lingue.
🦾 "i modelli di linguaggio sono una forza dirompente per le aziende".
#AI #IntelligenzaArtificiale #LLM
---
#GPT4 #multimodalita #ai #intelligenzaartificiale #LLM
🍔 La campagna che si vede nelle immagini è stata generata attraverso l'AI: #Midjourney v4 + #GPT3. Le immagini degli hamburger le ho date come input all'algoritmo, aggiungendo il prompt testuale per le ambientazioni (#multimodalità).
#midjourney #gpt3 #multimodalita
🧠 Dopo #AudioML, arriva #MusicLM: un nuovo modello di #Google che permette di generare musica partendo da un prompt testuale.
😯 L'algoritmo è multimodale, quindi anche in grado di trasformare una descrizione testuale e una melodia di base (es. canticchiata) in un audio strutturato.
🎧 Gli esempi sono a dir poco sbalorditivi.
🔗 MusicLM: https://google-research.github.io/seanet/musiclm/examples/
🔗 Un approfondimento: https://www.alessiopomaro.it/algoritmi-generativi-video-suoni/
#audioml #musiclm #google #ai #texttomusic #intelligenzaartificiale #multimodalita
💡 "Un sistema addestrato solo sul linguaggio non si avvicinerà mai all'intelligenza umana, anche se viene addestrato da ora fino alla fine dell'universo".
👁️ Ecco perché tutti i sistemi vanno verso la #multimodalità: per dotare di "sensi" la macchina, per aumentare la sua comprensione del mondo.
👉 Da leggere il post: è scritto da due luminari in ambito di #AI.
#IntelligenzaArtificiale #GPT3 #LLM
---
#multimodalita #ai #intelligenzaartificiale #gpt3 #LLM
👁️ Alcuni esperimenti di ricerca usando #Multisearch di #Google.
🔎 Attraverso #Lens viene definito l'elemento visuale che può essere dettagliato con la componente testuale.
🔥 Parola d'ordine: #multimodalità.
#multisearch #google #lens #multimodalita #seo #search