En un mercat ple d'altaveus intel·ligents tancats, finalment apareix una alternativa que posa el control en mans de l'usuari: un assistent d'IA que s'entén i es repara. Així es presenta Ubo Pod Developer Edition (DE), un dispositiu obert sobre Raspberry Pi 4 o 5 que combina veu, visió per ordinador i sensors en un xassís modular que no necessita serveis propietaris per funcionar.
La idea no es limita a preguntar pel temps o posar-hi música. Ubo Pod aglutina micròfons, altaveus, una pantalla a color, càmera, sensorat ambiental i un sistema d'infrarojos (emissor i receptor) per conversar amb models de llenguatge, interpretar el que veu i, a més, fer servir equips del saló per veu. Tu tries si tires d'IA al núvol o si tot passa de forma local, prioritzant la privadesa, i si t'agrada trastejar, l'entorn està pensat per experimentar amb veu, visió i eines sense barallar-te amb la base.
Què és Ubo Pod Developer Edition i quin és el seu propòsit
La Developer Edition és el nucli del projecte. La seva ambició és substituir les “caixes negres” tipus Echo o Nest per un assistent construïble i auditable amb maquinari obert i programari lliure, lliure de lligams a serveis tancats. Amb el mateix equip habilita reconeixement automàtic de la parla (STT), síntesi de veu (TTS), models de llenguatge i de visió (LLMs/VLMs), cridades a eines (tool calling) i disparadors d'activació per a diferents escenaris.
La gràcia és que no obliga a programar-ho. Inclou una interfície gràfica a la pantalla integrada i una WebUI per configurar-lo sense tocar codi, de manera que puguis triar proveïdors d'IA, ajustar opcions i activar funcions directament des del dispositiu o des del navegador.
L'obertura travessa tot el disseny. Tant l'aplicació Ubo com el maquinari estan publicats amb llicències obertes i repositoris públics, incloses les plaques i els arxius mecànics. Si us ve de gust auditar, modificar o contribuir, teniu el sistema “a la vista”, cosa poc freqüent en aquest tipus d'assistents domèstics.
Disseny i maquinari: modular, ampliable i reparable
El xassís és compacte i pensat per perdurar. Mesura 130 × 99 × 52 mm, pesa al voltant de 340 grams i està preparat per allotjar Raspberry Pi 4 o Raspberry Pi 5, amb gestió tèrmica activa per mantenir el rendiment estable en sessions llargues.
Al frontal mana una pantalla IPS a color de 1,54 polzades amb 240 × 240 píxels. Tot i que no és gran, permet visualitzar estats, menús i una petita GUI integrada per fer ajustaments o consultar informació al moment, sense necessitat d'anar-te a l'ordinador.
Just al costat incorpora una càmera de 5 MP que dóna entrada a la visió per ordinador. A la variant Ubo Pro 4 es poden utilitzar les càmeres oficials Raspberry Pi V1 i V2; a Ubo Pro 5, a més, se suma compatibilitat amb el Camera Module 3, ampliant les opcions de captura i enfocament.
L´apartat d´àudio està preparat per a converses naturals. Disposa de doble micròfon estèreo amb captura de fins a 48 kHz i altaveus estèreo amb reproducció fins a 48 kHz amb una distorsió molt continguda (<0,1% THD). A la documentació apareixen referències a 1 W per canal i també a 2 W per altaveu; en qualsevol cas, el sistema està pensat per a veu clara a escriptori o saló.
Si preferiu treure el so a altres equips, hi ha una sortida de línia basada en el còdec WM8960. Lliurament 40 mW a 16 Ω, detecta la inserció de jack, declara THD de -75 dB a 20 mW i arriba a 90 dB SNR amb càrrega de 16 Ω, la qual cosa aporta flexibilitat per a barres de so, amplificadors o altaveus actius.
Per al control físic de l'ordinador, el frontal munta un teclat petit. Són 7 botons de silicona de tacte suau i un botó d'encesa dedicat, suficients per manejar menús o tenir dreceres a funcions.
La part “visual” es reforça amb un anell de llum. Integra 27 LEDs RGB direccionables (SK6812, compatibles amb NeoPixel), ideals per mostrar estats, animacions o retroalimentació durant converses.
En connectivitat hereta el que és bo de la Raspberry. Ofereix Ethernet Gigabit, WiFi 5, Bluetooth 5.0, dos ports USB 3.0 i dos USB 2.0 des de la pròpia SBC, amb marge de sobres per a perifèrics o acceleradors externs.
Un dels trets diferencials per a la llar és l'infraroig. Inclou receptor IR amb abast fins a 5 metres (TSOP75238) i quatre emissors IR de 940 nm d'alta potència (VSMB10940) amb patró pràcticament omnidireccional, cosa que li permet aprendre i reenviar ordres a televisors, barres de so o aire condicionat.
El sensorat ambiental també ve complet de sèrie. Incorpora un sensor de temperatura PCT2075 (precisió ±1 °C entre -25 °C i +100 °C) i un sensor de llum ambiental VEML7700, capaç de mesurar de 0 a 120 quilolux amb resolució fina de 0,0036 lx/ct.
En emmagatzematge, el paquet base porta la targeta a punt per arrencar. S'inclou una microSD de 32 GB preinstal·lada amb el sistema operatiu, de manera que puguis començar a utilitzar-lo només encendre'l.
Si fas el salt al model superior, hi ha premi. Ubo Pro 5 afegeix una ranura M.2 PCIe per a SSD NVMe o per muntar un accelerador d'IA, cosa molt útil per executar models locals exigents o guardar memòries i bases de coneixement sense preocupar-te per l'espai.
- Pantalla IPS 1,54” (240×240) per a interfície embeguda i estats
- Cambra 5 MP i suport oficial de càmeres Raspberry (segons model)
- Doble micro + altaveus estèreo optimitzats per a veu
- IR RX/TX per a control universal del saló
- Sensors de temperatura i llum amb precisió i ampli rang
Privadesa tangible i control de dades
Més enllà d?intencions, hi ha mesures físiques. La càmera es pot tapar amb una cortina de privadesa perquè quedi cega quan no la necessitis. I els micròfons compten amb un interruptor de tall per maquinari, cosa que et permet silenciar-los sense fiar-ho tot al programari.
L'arquitectura de programari acompanya aquesta filosofia. Pots treballar en mode totalment local o recolzar-te en serveis al núvol, modulant l'equilibri entre comoditat i privadesa segons cada cas. Si no voleu que surtin àudios o imatges de la vostra xarxa, el configureu per operar en local.
Programari obert, WebUI i compatibilitat amb més de 50 proveïdors de IA
El sistema base corre sobre Raspberry Pi US i la Ubo App. L'aplicació està escrita a Python i publicada a GitHub, de manera que no cal comprar l'aparell per provar-la: es pot instal·lar a una Raspberry Pi 4 o 5 que ja tinguis.
La compatibilitat de serveis és àmplia i variada. Ubo Pod admet més de 50 proveïdors per a reconeixement de veu, TTS, memòria, visió i LLMs, amb opcions tant al núvol com on-premise/local que es trien des de la pantalla o des de la interfície web.
Si prefereixes decidir tu cada model, també ho pots fer. És possible apuntar a endpoints d'APIs populars com Gemini, ChatGPT o Claude, o recórrer a Ollama per executar LLMs en local, reduint latència i mantenint les dades a casa.
Per ampliar capacitats sense complicar-te, hi ha una API pensada per a desenvolupadors. El sistema exposa una API gRPC que permet crear mòduls o integracions amb poques línies de codi, facilitant afegir funcions a mida de cada projecte.
La capa conversacional no es queda respondre amb text. El suport de tool calling i els diferents mecanismes dactivació permeten encadenar accions, llegir sensors, mostrar dades a la pantalla o il·luminar l'anell LED segons l'estat.
Visió per ordinador i infrarojos: la llar sota la teva veu
La càmera integrada i el suport de mòduls oficials fan que el dispositiu “vegi”. Podeu reconèixer codis, caràcters, gestos i objectes, obrint la porta a escenaris com llegir un codi a la pantalla, detectar un senyal de confirmació o descriure una escena per donar-te context.
El control universal per infrarojos és l'altre gran aliat pel dia a dia. Pots ensenyar-li ordres del teu comandament favorit perquè els reprodueixi o directament demanar-li per veu que enviï senyals a la tele, la barra de so o l'aire condicionat.
Experiència d'ús senzilla… i llesta per trastejar
Tot i que la DE és per a perfils tècnics, no us obliga a programar. Arrenca funcional i et pots limitar a configurar-la des de la WebUI sense escriure res de codi si no et ve de gust. Endollar, ajustar quatre coses ia funcionar.
Si us agrada aixecar el capó, el terreny és ideal. El maquinari modular i el programari obert permeten canviar peces, afegir emmagatzematge M.2 a Pro 5 o provar acceleradors d'IA. I si no vols complicar-te, et quedes amb allò que ve i punt.
Models, especificacions clau i diferències
La família gira al voltant de Raspberry Pi 4 o 5, amb dues variants principals. Ubo Pro 4 i Ubo Pro 5 comparteixen base (pantalla IPS 1,54” 240×240, càmera 5 MP, doble micro i altaveu, IR, sensors, anell LED, teclat de 7 botons), però difereixen en alguns punts.
- Cambres oficials: Pro 4 admet els mòduls Raspberry Pi V1 i V2; Pro 5 suma compatibilitat amb Camera Module 3.
- Emmagatzematge i acceleració: Pro 5 integra ranura M.2 PCIe per a SSD NVMe o accelerador d'IA.
- Conectivitat: tots dos hereten Ethernet Gigabit, WiFi 5, Bluetooth 5.0, 2×USB 3.0 i 2×USB 2.0.
- Audio XNUMX: altaveus estèreo i sortida de línia WM8960 amb detecció de jack.
- Sistema: microSD de 32 GB preinstal·lada per arrencar sense complicacions.
Preus, disponibilitat i realitats del crowdfunding
El projecte és a Kickstarter amb un objectiu de finançament de 25.000 dòlars. Les recompenses arrenquen en 109$ per Ubo Pro 4 i 129$ per Ubo Pro 5. Tingues en compte que cap inclou la Raspberry Pi a la caixa, i els enviaments van a part.
Com sempre en micromecenatge, convé ser prudent. Donar suport no és el mateix que comprar: donar suport a un projecte no garanteix el lliurament. Revisa la informació, sospesa riscos i decideix quant et compensa implicar-te.
Pots consultar la campanya a la pàgina oficial. Entra a Kickstarter d'Ubo Pod per veure detalls, nivells i terminis abans de participar-hi.
Estat del projecte i missatge del creador
Segons el seu impulsor, al cap de dos dies d'obrir campanya ja fregava gairebé el 40% de la meta. Demana una empenta final i agraeix la difusió, sobretot entre perfils tècnics als quals els entusiasme un assistent obert i piratejable.
Hi ha un detall poc comú en campanyes així: es va fabricar un lot petit per avançat i hi ha una mica d'inventari llest per enviar els primers patrocinadors, reflectint els anys de treball en maquinari i programari darrere de la proposta.
L'objectiu del creador és cristal·lí. Donar poder a desenvolupadors per construir experiències de veu, visió i sensors sense friccions, i plantar cara a dispositius tancats que, segons la seva opinió, no respecten prou el consumidor ni el seu dret a reparar o triar serveis.
En visibilitat, lequip demana idees. Coneixen les agències de màrqueting de pagament, però de moment aposten per comunitat i boca a boca, buscant un creixement més orgànic.
Configuració i flux de treball (sense convertir-lo en un tutorial)
El dispositiu està pensat per passar de zero a útil en poc temps. La interfície web us guiarà en l'elecció de proveïdors d'IA (veu, text, visió, memòria) ia la configuració bàsica, i la GUI de la pantalla permet ajustaments ràpids sense sortir de l'equip.
Si vols provar abans d'invertir al maquinari, cap problema. La Ubo App es pot instal·lar en una Raspberry Pi 4 o 5 “pelada”, de manera que comproveu compatibilitats, rendiment i si us encaixa l'ecosistema.
Per a escenaris de màxima privadesa, hi ha marge de maniobra. Pots optar per opcions locals o on-premise perquè àudio i imatge no surtin de la teva xarxa. I si necessites potència extra o models comercials concrets, tens a mà proveïdors al núvol i la possibilitat d'apuntar a API com Gemini, ChatGPT o Claude.
Casos pràctics i donem disponibles
Ja hi ha exemples reals que ensenyen què pot fer. Memo, l'assistent de notes per veu, manté memòria i context a la conversa, ideal per capturar recordatoris o idees sense perdre el fil.
En visió, la cosa va més enllà de “veure”. Podeu generar imatges a partir d'instruccions de veu i descriure fotos mitjançant VLMs, amb resultats que dependran dels models i proveïdors triats, però amb la infraestructura llista.
Pel saló, l'IR brilla amb llum pròpia. És perfectament viable demanar-li que canviï de canal, pugi volum o apagueu la tele, sempre que el teu equip rebi ordres per infrarojos. I si ho combines amb els sensors de llum i temperatura, és fàcil crear automatitzacions contextuals senzilles.
Motius per triar un assistent obert
Els assistents tancats són molt còmodes, però tenen peatges. Amb Ubo Pod decideixes quins serveis fas servir, on es processen les teves dades i pots inspeccionar el codi, el que per a molts marca la diferència entre fer servir una eina o “ser usat” per ella.
El maquinari, a més, no està soldat en una placa propietària. En recolzar-se a Raspberry Pi, és possible actualitzar, reparar o reutilitzar components, alguna cosa valuós quan l'obsolescència prem i vols allargar la vida útil dels teus dispositius.
Limitacions i matisos a considerar
No tot és perfecte, i cal tenir-ho clar. Cap recompensa inclou la Raspberry Pi, així que has de sumar el cost i disponibilitat a l'equació de compra. I en àudio veuràs xifres que parlen de 1 W per canal i també de 2 W per altaveu; si el volum màxim és crític, millor valorar el context (escriptori o estada petita) o fer servir la sortida de línia amb altaveus externs.
És un projecte viu que evoluciona. La llista de proveïdors, les funcions i el rendiment local depenen de la comunitat, de les dependències i de si muntes una Pi 4 o 5. La cara positiva és que, en ser obert, sempre podràs adaptar i millorar amb el temps.
Es tracta d'una alternativa que aporta control, privadesa i capacitat de personalització sense sacrificar utilitat. Un assistent d'IA amb visió, sensors i infrarojos, maquinari modular i compatibilitat amb més de 50 serveis que aterra via crowdfunding amb preus dentrada continguts i un enfocament radicalment obert.