Die #KI Kosmos-1 von Microsoft löst visuelle Rätsel und erklärt Bilder:
#Kosmos1 soll weiter bildlich dargestellten Text erkennen, visuelle Intelligenztests bestehen und Sprachanweisungen befolgen können.
🌟Das Besondere ist: es ist ein multimodales großes Sprachmodell. Das #MLLM hat die Fähigkeit Input mehrerer unterschiedlicher Wahrnehmungs- und Darstellungsarten zu erkennen und im Kontext sinngemäß zu erfassen.
#meinZiel23 #artificialintelligence
Quelle: https://social.heise.de/@heisedeveloper/109953948192772005
#ki #kosmos1 #mllm #meinziel23 #artificialintelligence
Be afraid. Be very afraid. It begins.
#Microsoft's new Kosmos-1 is a Multimodal Large Language Model (#MLLM) that can understand images, text, images with text, OCR, image captioning, visual QA, and even solve IQ tests. It was evaluated on various tasks and datasets, and the team behind the paper has been identified. AlphaSignal's weekly summary is a great way to stay up to date with the latest breakthroughs in #AI. https://mem.ai/p/BYx42WLVOn9fozYo3GVP