En un panorama dominat per altaveus intel·ligents tancats, apareix una alternativa que canvia les regles: un assistent d'IA de codi obert pensat per als que volen comprendre i controlar el que passa sota el capó. Aquest buit el cobreix Ubo Pod, un dispositiu que combina Raspberry Pi 4 o 5, veu, visió per ordinador i sensors, tot en una carcassa modular i reparable que no depèn de serveis propietaris per funcionar.
La proposta va molt més enllà de demanar música o temps. Ubo Pod integra micròfons, altaveus, pantalla, cà mera, sensors i fins i tot emissor i receptor d'infrarojos per parlar amb models de llenguatge, reconèixer el que veu i, de passada, controlar el teu tele o qualsevol equip compatible. Pots triar entre IA al núvol o totalment local per prioritzar la privadesa, i si et ve de gust experimentar, ofereix un entorn perfecte per desenvolupar les teves pròpies experiències amb veu, visió i eines.
Què és Ubo Pod i què pretén
L'edició per a desenvolupadors, batejada Developer Edition (DE), Ć©s el cor del projecte. La seva missió Ć©s reemplaƧar les ācaixes negresā tipus Amazon Echo o Google Nest amb maquinari obert i programari lliure, sense lligams a una plataforma concreta. AixĆ, el mateix equip habilita reconeixement de veu (speech-to-text), sĆntesi (text-to-speech), models de llenguatge i visió (LLMs/VLMs), crides a eines (tool calling) i diversos mecanismes d'activació.
Ubo Pod no nomĆ©s busca ser hackejable; tambĆ© vol ser còmode per a qui no vulgui programar. Inclou una interfĆcie grĆ fica embeguda a la seva petita pantalla i una WebUI per configurar-lo sense escriure codi. Això permet seleccionar serveis d'IA, ajustar opcions i activar funcions des del dispositiu o des del navegador, amb un enfocament prĆ ctic i clar.
La filosofia oberta es nota a tot el disseny. Tant el programari com el maquinari són open-source, amb repositoris públics del codi de l'app Ubo i de les plaques i fitxers mecà nics. Si vols auditar, modificar o contribuir, tens el pla complet del sistema, cosa inusual en aquest tipus d'assistents de consum.
Disseny i maquinari: modular, ampliable i reparable
El xassĆs de Ubo Pod Ć©s compacte i pensat per durar. Mesura 130 x 99 x 52 mm i pesa uns 340 grams, amb un interior preparat per a la Raspberry Pi 4 o la Raspberry Pi 5 i una gestió tĆØrmica activa que ajuda a mantenir el rendiment estable. La carcassa modular facilita substituir components, ampliar l'equip i, si cal, reparar-lo sense drames.
Al frontal destaca una pantalla IPS en color de 1,54 polzades amb 240 x 240 pĆxels. Tot i que petita, la pantalla permet mostrar estat, menĆŗs i una interfĆcie embeguda per configurar i consultar informació al vol. Al costat, una cĆ mera integrada de 5 MP aporta visió per ordinador. A la variant Ubo Pro 4 s'admet a mĆ©s l'Ćŗs dels mòduls oficials de cambra de Raspberry Pi V1 i V2; ia Ubo Pro 5 tambĆ© se suporta el Raspberry Pi Camera Module 3, ampliant les possibilitats de visió.
L'apartat acĆŗstic estĆ ben equipat per a converses naturals. Compte amb doble micròfon estĆØreo amb captura d'Ć udio de fins a 48 KHz, i altaveus estĆØreo amb reproducció de fins a 48 KHz i distorsió molt continguda (<0,1% THD). A la documentació s'esmenten 1 W per canal i en una altra descripció es parla de 2 W per altaveu; en qualsevol cas, el sistema estĆ orientat a la veu clara ia la interacció a escriptori o saló. Per a usos externs, integra una sortida de lĆnia (WM8960) amb 40 mW a 16 Ī©, detecció d'inserció de jack, THD de -75 dB a 20 mW i SNR de 90 dB amb cĆ rrega de 16 Ī©.
Per a la interacció fĆsica, la unitat inclou un teclat amb set botons de silicona āsoft-touchā i un botó d'encesa dedicat. A mĆ©s, llueix un anell LED amb 27 dĆodes RGB direccionables (SK6812), compatible amb NeoPixel, perfecte per a senyals visuals, estats o efectes.
En connectivitat, hereta el millor de la Raspberry. Disposa de Gigabit Ethernet, WiFi 5, Bluetooth 5.0, dos USB 3.0 i dos USB 2.0 a la SBC, per la qual cosa no trobarĆ s a faltar ports per afegir perifĆØrics o accelerar fluxos de treball.
Un dels seus punts diferencials per a la llar és el control per infrarojos. Integra receptor IR amb abast de fins a 5 metres (TSOP75238) i quatre emissors IR de 940 nm d'alta potència i velocitat (VSMB10940), amb patró omnidireccional. Això obre la porta a manejar televisors, barres de so o altres equips que acceptin ordres IR, ja sigui reenviant senyals des d'un comandament universal o emetent-los per veu.
El sensorat també és complet. Porta un sensor de temperatura PCT2075 (precisió ±1 °C entre -25 °C i +100 °C) i un sensor de llum ambiental VEML7700, capaç de mesurar de 0 a 120 quilolux amb resolució fina de 0,0036 lx/ct. Aquestes dades ambientals es poden integrar en automatitzacions o en respostes contextuals de l'assistent.
En emmagatzematge, de sèrie inclou una targeta microSD de 32 GB preinstal·lada amb el sistema operatiu. La versió Ubo Pro 5 suma una ranura M.2 PCIe per a SSD NVMe o per afegir un accelerador d'IA, una millora interessant si preveus córrer models locals exigents o guardar grans bases de dades i memòries.

Privadesa real: cortina fĆsica i tall de micròfons per maquinari
MĆ©s enllĆ del discurs, la privadesa es materialitza en elements fĆsics. La cĆ mera es pot bloquejar amb una cortina de privadesa fĆsica, perquĆØ quedi completament tapada quan no la vulguis fer servir. Els micròfons, per la seva banda, compten amb un interruptor de desconnexió per maquinari, de manera que els puguis silenciar sense confiar nomĆ©s en programari.
Aquesta aposta es complementa amb larquitectura de programari. Ubo Pod permet treballar amb serveis al nĆŗvol o de forma totalment local, mantenint el control de les teves dades i ajustant l'equilibri entre comoditat i privadesa segons el cas. Si vols un assistent que no pugi Ć udio ni imatges a servidors externs, pots configurar-lo perquĆØ tot passi a la teva xarxa o al propi dispositiu.
Programari obert, WebUI sense codi i més de 50 proveïdors d'IA
Sota el capó corre Raspberry Pi OS i la Ubo App, escrita a Python i publicada a GitHub. No cal comprar l'aparell per provar l'experiència: l'app es pot instal·lar a una Raspberry Pi 4 o 5, de manera que puguis experimentar amb el programari abans de decidir-te pel maquinari complet.
La compatibilitat amb proveĆÆdors dIA Ć©s Ć mplia. Ubo Pod suporta mĆ©s de 50 serveis per a reconeixement de veu, sĆntesi de veu, memòria, visió i models de llenguatge. Aquesta llista inclou opcions al nĆŗvol i solucions locals/on-premise, i pots seleccionar-les des de la pantalla integrada o via la interfĆcie web.
Si prefereixes triar els models, tambĆ© pots. Ćs possible apuntar a adreces d'API de models populars com Gemini, ChatGPT o Claude, o utilitzar Ollama per córrer LLMs al mateix maquinari, de manera que la latĆØncia baixa i les dades no surten de casa.
Per desenvolupar extensions, hi ha una API gRPC pensada perquĆØ en poques lĆnies de codi hi puguis afegir capacitats. Entre els exemples prĆ ctics hi ha un assistent de notes de veu (Memo) amb memòria i context, generació d'imatges a partir de veu, descripció d'imatges mitjanƧant VLMs, o el control del televisor amb l'emissor IR mitjanƧant ordres de veu.
La capa d'interacció es completa amb diverses maneres d'activar l'assistent i trucades a eines (tool calling). Tot plegat ofereix un flux conversacional ric que no es limita a respostes de text, sinó que podeu executar accions, llegir sensors, mostrar informació a la pantalla o il·luminar l'anell LED segons l'estat.
Visió i control per infrarojos: la llar sota la teva veu
La cà mera integrada i la compatibilitat amb mòduls oficials de Raspberry Pi converteixen Ubo Pod en un dispositiu amb visió pròpia. El sistema pot reconèixer codis, carà cters, gestos o objectes, cosa que obre la porta a casos d'ús tan variats com llegir un codi a la pantalla, detectar un gest de confirmació o descriure una escena.
El control universal mitjanƧant infrarojos Ć©s un altre punt fort orientat a la vida diĆ ria. Pots āensenyar-liā ordres del teu comandament favorit perquĆØ l'assistent els reprodueixi, o bĆ© demanar-li per veu que enviĆÆ senyals directament a altres aparells (com la tele o l'aire condicionat). Ćs el tipus dintegració que fa que un assistent aporti utilitat immediata des del primer dia.
Experiència d'ús sense complicacions⦠i llesta per trastejar
Encara que Ć©s un dispositiu per a desenvolupadors, no us obliga a ser-ho. Arriba funcional des de la primera arrencada i pots limitar-te a configurar-ho des del seu WebUI sense escriure una sola lĆnia de codi. D'aquĆ endavant, tu decideixes si et quedes amb l'experiĆØncia bĆ sica, o si entres en farina i crees les teves pròpies apps, models o integracions.
Qui gaudeixi āaixecant el capóā trobarĆ un terreny de joc ideal. La modularitat del maquinari i el programari obert faciliten substituir components, afegir emmagatzematge M.2 al Pro 5 o provar acceleradors d'IA. I si t'espanta trencar alguna cosa, sempre pots quedar-te amb el que ve de sĆØrie: el potencial de personalització Ć©s aquĆ quan et vingui de gust.
Models, especificacions clau i diferĆØncies
La famĆlia Ubo s'articula al voltant de les variants que abracen Raspberry Pi 4 o Raspberry Pi 5. Ubo Pro 4 i Ubo Pro 5 comparteixen la base (pantalla IPS 1,54ā 240Ć240, cĆ mera 5 MP, doble micro i doble altaveu, IR, sensors, anell LED, teclat de 7 botons), però difereixen en alguns punts importants.
A cà meres oficials, Ubo Pro 4 suporta els mòduls Raspberry Pi V1 i V2, Mentre que Ubo Pro 5 afegeix compatibilitat amb la Camera Module 3. La versió Pro 5 fa un altre salt amb la ranura M.2 PCIe per a SSD NVMe o acceleradors d'IA, ideal per a emmagatzematge rà pid o per a descarregar còmput del processador quan executis models locals.
Totes dues comparteixen la base de connectivitat de la SBC: Ethernet Gigabit, WiFi 5, Bluetooth 5.0, dos USB 3.0 i dos USB 2.0. En Ć udio, a mĆ©s del sistema d'altaveus estĆØreo i els micròfons, la sortida de lĆnia WM8960 amb detecció de jack afegeix flexibilitat per a equips externs. El paquet es completa amb targeta microSD de 32 GB preinstalĀ·lada amb el sistema operatiu.
Preus, disponibilitat i la realitat del crowdfunding
El projecte ha arribat a la comunitat mitjanƧant Kickstarter amb un objectiu de finanƧament de 25.000 dòlars. Les recompenses parteixen de 109 dòlars per a Ubo Pro 4 i 129 dòlars per a Ubo Pro 5. Ćs important tenir en compte que cap d'aquestes versions no inclou la Raspberry Pi a la caixa: haurĆ s d'aportar la teva pròpia SBC. Tampoc no estan incloses les despeses d'enviament.
Com en qualsevol campanya de micromecenatge, cal tenir presents els riscos. En un dels avisos es recorda que ādonar suport no Ć©s el mateix que comprarā: donar suport a un projecte no garanteix el lliurament. Sigues prudent, revisa la informació, i valora el risc abans de comprometre els teus diners.
La pà gina oficial de la campanya és: https://www.kickstarter.com/projects/ubopod/ubo-pod-hackable-personal-ai-assistant. L'equip anima a difondre el projecte ia sumar-s'hi si t'atrau la proposta tècnica.
Estat del projecte i missatge del creador
L'impulsor de l'Ubo Pod ha compartit que, al cap de dos dies de llançar la campanya, ja fregava el 40% de l'objectiu. Demana una petita empenta per creuar la meta i agraeix la difusió, especialment entre perfils tècnics a qui els entusiasme el concepte.
Hi ha un aspecte poc comú al crowdfunding: es va fabricar un lot petit per avançat i hi ha una mica d'inventari llest per enviar immediatament als primers patrocinadors. Aquesta decisió reflecteix els anys de treball invertits en el maquinari i el programari i la passió darrere del projecte.
L'objectiu declarat del creador és clar: donar poder a desenvolupadors per construir experiències interactives amb veu, visió i sensors amb facilitat. També expressa el seu cansament amb els dispositius de grans corporacions: tancats, lligats a serveis i, segons la seva opinió, poc respectuosos amb els drets del consumidor.
Pel que fa a la visibilitat, sol·licita suggeriments per amplificar l'abast. Coneix les agències de mà rqueting de pagament, però ha decidit no prendre aquest camà per ara, apostant al seu lloc per la comunitat i el boca a boca.
Configuració i flux de treball (sense convertir-lo en un tutorial)
Ubo Pod estĆ pensat perquĆØ passis de zero a Ćŗtil en poc temps. La interfĆcie web guia la selecció de proveĆÆdors d'IA (veu, text, visió, memòria) i la configuració bĆ sica, mentre que la GUI integrada a la pantalla permet certs ajustaments sense necessitat d'obrir el navegador.
Per als qui vulguin avaluar abans d'invertir al maquinari, la Ubo App es pot instalĀ·lar en una Raspberry Pi 4/5 āpeladaā. AixĆ pots comprovar compatibilitats, explorar l'ecosistema i valorar quin model et convĆ© mĆ©s o si n'hi ha prou de córrer-lo a la teva pròpia placa.
En escenaris de privadesa estricta, pots optar per opcions locals o on-premise, evitant que l'Ć udio i les imatges surtin de la teva xarxa. I si busques potĆØncia o models especĆfics de tercers, tens al teu abast proveĆÆdors al nĆŗvol i la possibilitat d'apuntar a API de Gemini, ChatGPT o Claude, entre d'altres.
Casos prĆ ctics i donem ja disponibles
Més enllà de la teoria, ja hi ha exemples funcionals que mostren què és capaç. Memo, l'assistent de notes, manté memòria i context a la conversa, cosa que el fa ideal per capturar recordatoris o idees sense perdre el fil.
A l'apartat visual, podeu generar imatges a partir d'una instrucció de veu i obtenir descripcions d'imatges mitjançant models de visió-llenguatge (VLM). La precisió i la utilitat dependran dels proveïdors i models que seleccionis, però la infraestructura està preparada.
Pel saló, el control IR brilla amb llum pròpia. Ćs perfectament viable dir a l'assistent que canviĆÆ de canal, ajusti el volum o apagueu la tele, sempre que l'equip rebi ordres per infrarojos. En combinació amb la detecció ambiental (temperatura i llum), podeu crear comportaments contextuals senzills.
Per quĆØ triar un assistent obert
Els assistents tancats ofereixen comoditat però a canvi de control i flexibilitat. Amb Ubo Pod, tries proveĆÆdors, decideixes on es processen les teves dades i pots inspeccionar el codi. Per a molts, això no Ć©s un detall, sinó la diferĆØncia entre fer servir una eina i āser usatā per ella.
A més, el maquinari no està soldat a una placa propietà ria d'un sol proveïdor. L'ús de Raspberry Pi us permet actualitzar, reparar o reaprofitar components, una cosa especialment valuosa en un context de rà pida obsolescència tecnològica.
Limitacions a considerar
Com tot projecte de maquinari obert, hi ha matisos importants. Les recompenses no inclouen la Raspberry Pi, aixĆ que haurĆ s de sumar aquest cost i disponibilitat. En Ć udio, segons la documentació, veurĆ s xifres que esmenten 1 W per canal i tambĆ© 2 W per altaveu; si el volum mĆ xim Ć©s crucial per a tu, valora el context dĆŗs (escriptori o estada petita) o lĆŗs de la sortida de lĆnia amb altaveus externs.
Per altra banda, Ć©s un projecte en evolució. La llista de proveĆÆdors d'IA, les funcions i el rendiment local depenen de la comunitat, de les dependĆØncies i de la Pi que muntis (4 o 5). La bona notĆcia Ć©s que, en ser obert, podrĆ s adaptar i millorar amb el temps.
Ubo Pod encaixa en un nĆnxol que cada vegada demana mĆ©s veu i mĆ©s control: gent que vol un assistent Ćŗtil, amb visió i sensors, però sense renunciar a la privadesa ia la possibilitat de furgar quan li vingui de gust. Amb maquinari modular, programari obert, compatibilitat amb mĆ©s de 50 proveĆÆdors de IA, opcions locals i una WebUI sense codi, el projecte posa en mans de la comunitat una alternativa real a les caixes negres del mercat. Si et batega la idea, la campanya a Kickstarter āamb preus que parteixen en 109$ per al Pro 4 i 129$ per al Pro 5, sense incloure la Raspberry Pi ni l'enviamentā Ć©s el punt de partida per recolzar i, si ets dels primers, fins i tot rebre unitats del lot inicial ja fabricat.