Ubo Pod, l'assistent d'IA obert amb Raspberry Pi, visió i veu

  • Assistent de IA obert basat en Raspberry Pi 4/5 amb visió, veu i sensors
  • Maquinari modular amb privadesa fĆ­sica, IR, pantalla, LED i Ć mplia connectivitat
  • Programari open-source, WebUI sense codi i mĆ©s de 50 proveĆÆdors d'IA
  • Campanya a Kickstarter amb preus des de 109 $ sense incloure la Raspberry Pi

Assistent d'IA obert Ubo Pod

En un panorama dominat per altaveus intel·ligents tancats, apareix una alternativa que canvia les regles: un assistent d'IA de codi obert pensat per als que volen comprendre i controlar el que passa sota el capó. Aquest buit el cobreix Ubo Pod, un dispositiu que combina Raspberry Pi 4 o 5, veu, visió per ordinador i sensors, tot en una carcassa modular i reparable que no depèn de serveis propietaris per funcionar.

La proposta va molt més enllà de demanar música o temps. Ubo Pod integra micròfons, altaveus, pantalla, càmera, sensors i fins i tot emissor i receptor d'infrarojos per parlar amb models de llenguatge, reconèixer el que veu i, de passada, controlar el teu tele o qualsevol equip compatible. Pots triar entre IA al núvol o totalment local per prioritzar la privadesa, i si et ve de gust experimentar, ofereix un entorn perfecte per desenvolupar les teves pròpies experiències amb veu, visió i eines.

Què és Ubo Pod i què pretén

L'edició per a desenvolupadors, batejada Developer Edition (DE), Ć©s el cor del projecte. La seva missió Ć©s reemplaƧar les ā€œcaixes negresā€ tipus Amazon Echo o Google Nest amb maquinari obert i programari lliure, sense lligams a una plataforma concreta. AixĆ­, el mateix equip habilita reconeixement de veu (speech-to-text), sĆ­ntesi (text-to-speech), models de llenguatge i visió (LLMs/VLMs), crides a eines (tool calling) i diversos mecanismes d'activació.

Ubo Pod no només busca ser hackejable; també vol ser còmode per a qui no vulgui programar. Inclou una interfície gràfica embeguda a la seva petita pantalla i una WebUI per configurar-lo sense escriure codi. Això permet seleccionar serveis d'IA, ajustar opcions i activar funcions des del dispositiu o des del navegador, amb un enfocament pràctic i clar.

La filosofia oberta es nota a tot el disseny. Tant el programari com el maquinari són open-source, amb repositoris públics del codi de l'app Ubo i de les plaques i fitxers mecànics. Si vols auditar, modificar o contribuir, tens el pla complet del sistema, cosa inusual en aquest tipus d'assistents de consum.

Disseny i maquinari: modular, ampliable i reparable

El xassís de Ubo Pod és compacte i pensat per durar. Mesura 130 x 99 x 52 mm i pesa uns 340 grams, amb un interior preparat per a la Raspberry Pi 4 o la Raspberry Pi 5 i una gestió tèrmica activa que ajuda a mantenir el rendiment estable. La carcassa modular facilita substituir components, ampliar l'equip i, si cal, reparar-lo sense drames.

Al frontal destaca una pantalla IPS en color de 1,54 polzades amb 240 x 240 píxels. Tot i que petita, la pantalla permet mostrar estat, menús i una interfície embeguda per configurar i consultar informació al vol. Al costat, una càmera integrada de 5 MP aporta visió per ordinador. A la variant Ubo Pro 4 s'admet a més l'ús dels mòduls oficials de cambra de Raspberry Pi V1 i V2; ia Ubo Pro 5 també se suporta el Raspberry Pi Camera Module 3, ampliant les possibilitats de visió.

L'apartat acústic està ben equipat per a converses naturals. Compte amb doble micròfon estèreo amb captura d'àudio de fins a 48 KHz, i altaveus estèreo amb reproducció de fins a 48 KHz i distorsió molt continguda (<0,1% THD). A la documentació s'esmenten 1 W per canal i en una altra descripció es parla de 2 W per altaveu; en qualsevol cas, el sistema està orientat a la veu clara ia la interacció a escriptori o saló. Per a usos externs, integra una sortida de línia (WM8960) amb 40 mW a 16 Ω, detecció d'inserció de jack, THD de -75 dB a 20 mW i SNR de 90 dB amb càrrega de 16 Ω.

Per a la interacció fĆ­sica, la unitat inclou un teclat amb set botons de silicona ā€œsoft-touchā€ i un botó d'encesa dedicat. A mĆ©s, llueix un anell LED amb 27 dĆ­odes RGB direccionables (SK6812), compatible amb NeoPixel, perfecte per a senyals visuals, estats o efectes.

En connectivitat, hereta el millor de la Raspberry. Disposa de Gigabit Ethernet, WiFi 5, Bluetooth 5.0, dos USB 3.0 i dos USB 2.0 a la SBC, per la qual cosa no trobarĆ s a faltar ports per afegir perifĆØrics o accelerar fluxos de treball.

Un dels seus punts diferencials per a la llar és el control per infrarojos. Integra receptor IR amb abast de fins a 5 metres (TSOP75238) i quatre emissors IR de 940 nm d'alta potència i velocitat (VSMB10940), amb patró omnidireccional. Això obre la porta a manejar televisors, barres de so o altres equips que acceptin ordres IR, ja sigui reenviant senyals des d'un comandament universal o emetent-los per veu.

El sensorat també és complet. Porta un sensor de temperatura PCT2075 (precisió ±1 °C entre -25 °C i +100 °C) i un sensor de llum ambiental VEML7700, capaç de mesurar de 0 a 120 quilolux amb resolució fina de 0,0036 lx/ct. Aquestes dades ambientals es poden integrar en automatitzacions o en respostes contextuals de l'assistent.

En emmagatzematge, de sèrie inclou una targeta microSD de 32 GB preinstal·lada amb el sistema operatiu. La versió Ubo Pro 5 suma una ranura M.2 PCIe per a SSD NVMe o per afegir un accelerador d'IA, una millora interessant si preveus córrer models locals exigents o guardar grans bases de dades i memòries.

Maquinari modular Ubo Pod

Privadesa real: cortina física i tall de micròfons per maquinari

Més enllà del discurs, la privadesa es materialitza en elements físics. La càmera es pot bloquejar amb una cortina de privadesa física, perquè quedi completament tapada quan no la vulguis fer servir. Els micròfons, per la seva banda, compten amb un interruptor de desconnexió per maquinari, de manera que els puguis silenciar sense confiar només en programari.

Aquesta aposta es complementa amb larquitectura de programari. Ubo Pod permet treballar amb serveis al nĆŗvol o de forma totalment local, mantenint el control de les teves dades i ajustant l'equilibri entre comoditat i privadesa segons el cas. Si vols un assistent que no pugi Ć udio ni imatges a servidors externs, pots configurar-lo perquĆØ tot passi a la teva xarxa o al propi dispositiu.

Programari obert, WebUI sense codi i més de 50 proveïdors d'IA

Sota el capó corre Raspberry Pi OS i la Ubo App, escrita a Python i publicada a GitHub. No cal comprar l'aparell per provar l'experiència: l'app es pot instal·lar a una Raspberry Pi 4 o 5, de manera que puguis experimentar amb el programari abans de decidir-te pel maquinari complet.

La compatibilitat amb proveïdors dIA és àmplia. Ubo Pod suporta més de 50 serveis per a reconeixement de veu, síntesi de veu, memòria, visió i models de llenguatge. Aquesta llista inclou opcions al núvol i solucions locals/on-premise, i pots seleccionar-les des de la pantalla integrada o via la interfície web.

Si prefereixes triar els models, tambĆ© pots. Ɖs possible apuntar a adreces d'API de models populars com Gemini, ChatGPT o Claude, o utilitzar Ollama per córrer LLMs al mateix maquinari, de manera que la latĆØncia baixa i les dades no surten de casa.

Per desenvolupar extensions, hi ha una API gRPC pensada perquè en poques línies de codi hi puguis afegir capacitats. Entre els exemples pràctics hi ha un assistent de notes de veu (Memo) amb memòria i context, generació d'imatges a partir de veu, descripció d'imatges mitjançant VLMs, o el control del televisor amb l'emissor IR mitjançant ordres de veu.

La capa d'interacció es completa amb diverses maneres d'activar l'assistent i trucades a eines (tool calling). Tot plegat ofereix un flux conversacional ric que no es limita a respostes de text, sinó que podeu executar accions, llegir sensors, mostrar informació a la pantalla o il·luminar l'anell LED segons l'estat.

Visió i control per infrarojos: la llar sota la teva veu

La càmera integrada i la compatibilitat amb mòduls oficials de Raspberry Pi converteixen Ubo Pod en un dispositiu amb visió pròpia. El sistema pot reconèixer codis, caràcters, gestos o objectes, cosa que obre la porta a casos d'ús tan variats com llegir un codi a la pantalla, detectar un gest de confirmació o descriure una escena.

El control universal mitjanƧant infrarojos Ć©s un altre punt fort orientat a la vida diĆ ria. Pots ā€œensenyar-liā€ ordres del teu comandament favorit perquĆØ l'assistent els reprodueixi, o bĆ© demanar-li per veu que enviĆÆ senyals directament a altres aparells (com la tele o l'aire condicionat). Ɖs el tipus dintegració que fa que un assistent aporti utilitat immediata des del primer dia.

ExperiĆØncia d'Ćŗs sense complicacions… i llesta per trastejar

Encara que és un dispositiu per a desenvolupadors, no us obliga a ser-ho. Arriba funcional des de la primera arrencada i pots limitar-te a configurar-ho des del seu WebUI sense escriure una sola línia de codi. D'aquí endavant, tu decideixes si et quedes amb l'experiència bàsica, o si entres en farina i crees les teves pròpies apps, models o integracions.

Qui gaudeixi ā€œaixecant el capĆ³ā€ trobarĆ  un terreny de joc ideal. La modularitat del maquinari i el programari obert faciliten substituir components, afegir emmagatzematge M.2 al Pro 5 o provar acceleradors d'IA. I si t'espanta trencar alguna cosa, sempre pots quedar-te amb el que ve de sĆØrie: el potencial de personalització Ć©s aquĆ­ quan et vingui de gust.

Models, especificacions clau i diferĆØncies

La famĆ­lia Ubo s'articula al voltant de les variants que abracen Raspberry Pi 4 o Raspberry Pi 5. Ubo Pro 4 i Ubo Pro 5 comparteixen la base (pantalla IPS 1,54ā€ 240Ɨ240, cĆ mera 5 MP, doble micro i doble altaveu, IR, sensors, anell LED, teclat de 7 botons), però difereixen en alguns punts importants.

A càmeres oficials, Ubo Pro 4 suporta els mòduls Raspberry Pi V1 i V2, Mentre que Ubo Pro 5 afegeix compatibilitat amb la Camera Module 3. La versió Pro 5 fa un altre salt amb la ranura M.2 PCIe per a SSD NVMe o acceleradors d'IA, ideal per a emmagatzematge ràpid o per a descarregar còmput del processador quan executis models locals.

Totes dues comparteixen la base de connectivitat de la SBC: Ethernet Gigabit, WiFi 5, Bluetooth 5.0, dos USB 3.0 i dos USB 2.0. En àudio, a més del sistema d'altaveus estèreo i els micròfons, la sortida de línia WM8960 amb detecció de jack afegeix flexibilitat per a equips externs. El paquet es completa amb targeta microSD de 32 GB preinstal·lada amb el sistema operatiu.

Preus, disponibilitat i la realitat del crowdfunding

El projecte ha arribat a la comunitat mitjanƧant Kickstarter amb un objectiu de finanƧament de 25.000 dòlars. Les recompenses parteixen de 109 dòlars per a Ubo Pro 4 i 129 dòlars per a Ubo Pro 5. Ɖs important tenir en compte que cap d'aquestes versions no inclou la Raspberry Pi a la caixa: haurĆ s d'aportar la teva pròpia SBC. Tampoc no estan incloses les despeses d'enviament.

Com en qualsevol campanya de micromecenatge, cal tenir presents els riscos. En un dels avisos es recorda que ā€œdonar suport no Ć©s el mateix que comprarā€: donar suport a un projecte no garanteix el lliurament. Sigues prudent, revisa la informació, i valora el risc abans de comprometre els teus diners.

La pàgina oficial de la campanya és: https://www.kickstarter.com/projects/ubopod/ubo-pod-hackable-personal-ai-assistant. L'equip anima a difondre el projecte ia sumar-s'hi si t'atrau la proposta tècnica.

Estat del projecte i missatge del creador

L'impulsor de l'Ubo Pod ha compartit que, al cap de dos dies de llançar la campanya, ja fregava el 40% de l'objectiu. Demana una petita empenta per creuar la meta i agraeix la difusió, especialment entre perfils tècnics a qui els entusiasme el concepte.

Hi ha un aspecte poc comú al crowdfunding: es va fabricar un lot petit per avançat i hi ha una mica d'inventari llest per enviar immediatament als primers patrocinadors. Aquesta decisió reflecteix els anys de treball invertits en el maquinari i el programari i la passió darrere del projecte.

L'objectiu declarat del creador és clar: donar poder a desenvolupadors per construir experiències interactives amb veu, visió i sensors amb facilitat. També expressa el seu cansament amb els dispositius de grans corporacions: tancats, lligats a serveis i, segons la seva opinió, poc respectuosos amb els drets del consumidor.

Pel que fa a la visibilitat, sol·licita suggeriments per amplificar l'abast. Coneix les agències de màrqueting de pagament, però ha decidit no prendre aquest camí per ara, apostant al seu lloc per la comunitat i el boca a boca.

Configuració i flux de treball (sense convertir-lo en un tutorial)

Ubo Pod està pensat perquè passis de zero a útil en poc temps. La interfície web guia la selecció de proveïdors d'IA (veu, text, visió, memòria) i la configuració bàsica, mentre que la GUI integrada a la pantalla permet certs ajustaments sense necessitat d'obrir el navegador.

Per als qui vulguin avaluar abans d'invertir al maquinari, la Ubo App es pot instalĀ·lar en una Raspberry Pi 4/5 ā€œpeladaā€. AixĆ­ pots comprovar compatibilitats, explorar l'ecosistema i valorar quin model et convĆ© mĆ©s o si n'hi ha prou de córrer-lo a la teva pròpia placa.

En escenaris de privadesa estricta, pots optar per opcions locals o on-premise, evitant que l'Ć udio i les imatges surtin de la teva xarxa. I si busques potĆØncia o models especĆ­fics de tercers, tens al teu abast proveĆÆdors al nĆŗvol i la possibilitat d'apuntar a API de Gemini, ChatGPT o Claude, entre d'altres.

Casos prĆ ctics i donem ja disponibles

Més enllà de la teoria, ja hi ha exemples funcionals que mostren què és capaç. Memo, l'assistent de notes, manté memòria i context a la conversa, cosa que el fa ideal per capturar recordatoris o idees sense perdre el fil.

A l'apartat visual, podeu generar imatges a partir d'una instrucció de veu i obtenir descripcions d'imatges mitjançant models de visió-llenguatge (VLM). La precisió i la utilitat dependran dels proveïdors i models que seleccionis, però la infraestructura està preparada.

Pel saló, el control IR brilla amb llum pròpia. Ɖs perfectament viable dir a l'assistent que canviĆÆ de canal, ajusti el volum o apagueu la tele, sempre que l'equip rebi ordres per infrarojos. En combinació amb la detecció ambiental (temperatura i llum), podeu crear comportaments contextuals senzills.

Per quĆØ triar un assistent obert

Els assistents tancats ofereixen comoditat però a canvi de control i flexibilitat. Amb Ubo Pod, tries proveĆÆdors, decideixes on es processen les teves dades i pots inspeccionar el codi. Per a molts, això no Ć©s un detall, sinó la diferĆØncia entre fer servir una eina i ā€œser usatā€ per ella.

A més, el maquinari no està soldat a una placa propietària d'un sol proveïdor. L'ús de Raspberry Pi us permet actualitzar, reparar o reaprofitar components, una cosa especialment valuosa en un context de ràpida obsolescència tecnològica.

Limitacions a considerar

Com tot projecte de maquinari obert, hi ha matisos importants. Les recompenses no inclouen la Raspberry Pi, així que hauràs de sumar aquest cost i disponibilitat. En àudio, segons la documentació, veuràs xifres que esmenten 1 W per canal i també 2 W per altaveu; si el volum màxim és crucial per a tu, valora el context dús (escriptori o estada petita) o lús de la sortida de línia amb altaveus externs.

Per altra banda, és un projecte en evolució. La llista de proveïdors d'IA, les funcions i el rendiment local depenen de la comunitat, de les dependències i de la Pi que muntis (4 o 5). La bona notícia és que, en ser obert, podràs adaptar i millorar amb el temps.

Ubo Pod encaixa en un nĆ­nxol que cada vegada demana mĆ©s veu i mĆ©s control: gent que vol un assistent Ćŗtil, amb visió i sensors, però sense renunciar a la privadesa ia la possibilitat de furgar quan li vingui de gust. Amb maquinari modular, programari obert, compatibilitat amb mĆ©s de 50 proveĆÆdors de IA, opcions locals i una WebUI sense codi, el projecte posa en mans de la comunitat una alternativa real a les caixes negres del mercat. Si et batega la idea, la campanya a Kickstarter —amb preus que parteixen en 109$ per al Pro 4 i 129$ per al Pro 5, sense incloure la Raspberry Pi ni l'enviament— Ć©s el punt de partida per recolzar i, si ets dels primers, fins i tot rebre unitats del lot inicial ja fabricat.