Home Assistant Voice Preview Edition, a alternativa livre às Alexa e Siri para controlar casas inteligentes
Quando o assunto é caixas de som inteligentes, a Amazon tem a Alexa, Apple tem o HomePod e o Google tem o Nest. Se você quiser algo privado — que rode localmente — para controlar a sua casa, não existem alternativas.
Ou não existiam. Para fechar essa lacuna, a Nabu Casa, patrocinadora do projeto de código aberto Home Assistant, lançou o Home Assistant Voice Preview Edition.
Comprei seis desses aparelhos para substituir seis HomePods que tinha espalhados pela casa. Depois de algum tempo de uso, a pergunta que fica é: dá para confiar nesse para o uso no dia a dia, ou é melhor esperar por uma versão que não tenha “preview” no nome?
A caixa do Home Assistant Voice Preview Edition
O Home Assistant Voice Preview Edition (Voice PE daqui em diante) é um assistente de voz criado pela Nabu Casa, braço comercial do projeto Home Assistant. A proposta é simples: um dispositivo de voz que você controla, sem depender de grandes empresas.
A caixa é pequena e minimalista. Dentro você encontra o dispositivo em si, um guia rápido e informações de garantia. Como estamos em 2025, ela não traz cabo USB-C nem fonte de energia, então prepare-se para providenciá-los.
O design é discreto: um quadrado branco meio transparente, um anel de LED no topo que te dá retorno visual, um botão central, “dial” rotativo para volume (lembra o do iPod) e um interruptor físico que corta a energia dos microfones.
Na traseira há uma entrada USB-C para energia e uma entrada de fones de ouvido para conectar caixas de som externas.

Configuração inicial
A configuração é bem simples. Você liga o aparelho, abre o aplicativo do Home Assistant e ele já encontra o dispositivo. Um assistente te guia pelo resto do processo. Escolha a palavra de ativação, a voz da assistente e pronto.
Aliás, importante frisar: o dispositivo requer um servidor Home Assistant para funcionar. Se você não tem o Home Assistant rodando em casa nem a intenção de instalá-lo, esse produto não é pra você.
Em compensação, o Voice PE não exige conta na nuvem (em lugar algum, na verdade) e te oferece um nível de controle sem paralelo nas alternativas das big techs.
Os microfones
Temos seis Voice PE aqui em casa, todos funcionando direitinho. Configurei a chamada de ativação pra funcionar de forma local e os aparelhos geralmente entendem minha esposa e eu de forma rápida.
O microfone não é bom, mas também não é ruim. É só… ok. Não é bom como o do HomePod, mas é bom o suficiente.
O processador de áudio e os dois microfones fazem um trabalho decente de cancelamento de eco e remoção de ruído. Se você estiver perto, ele vai te entender sem problemas. Se estiver do outro lado da sala, vai precisar projetar a voz um pouco mais.
A sensibilidade pode ser ajustada nas configurações, o que ajuda.
Ele não tem o conceito de quem está falando, como no HomePod, então qualquer pessoa pode fazer pedidos. Se você estiver assistindo a algo e fizer um pedido, ela não sabe diferenciar entre a sua voz e a da TV.
É possível usar até duas palavras de ativação, cada uma com uma personalidade e idioma diferente, o que é uma vantagem bem legal. “Okay Nabu” pode entender pedidos em inglês e “Hey Jarvis” pode entender pedidos em português, por exemplo.
Existem três palavras de ativação possíveis oficialmente: Okay Nabu, Hey Jarvis, e Hey Mycroft. A comunidade treinou várias outras, mas usar elas requer reconfigurar o firmware manualmente, um processo bem chato.
O poder da IA
O processamento do pedido pode funcionar usando o Home Assistant, localmente, ou um modelo IA local ou remoto (na nuvem).
Aqui é onde o Voice PE brilha de verdade. O nível de flexibilidade é absurdo. As vantagens de usar uma IA pra processar os pedidos, seja ela local ou remoto, são muitas.
Por exemplo, ele pode inferir o que você quer dizer mesmo se você não for preciso, algo que o Home Assistant sozinho não consegue fazer. “Toque o álbum punk rock que tem o menino pelado na capa” vai ser entendido por um LLM, mas não pelo Home Assistant puro.
Você pode controlar a personalidade da assistente. Quer que ela responda em rimas? Em tom formal? Como um pirata? Dá para fazer. Isso vai muito além do que a Amazon ou o Google permitem.
No vídeo abaixo a GLaDOS responde a um pedido aqui em casa:
O nível de controle e as possibilidades que você tem com o dispositivo são sem igual. Você pode controlar um número limitado de dispositivos inteligentes com a Siri, Google Assistant ou Alexa, enquanto o Home Assistant te dá opções ilimitadas devido ao número de integrações já disponíveis e ao fato do projeto ser de código livre, permitindo a criação de integrações se o que você procura não está disponível.
Como exemplo, aqui em casa eu posso pedir à assistente para passar aspirador de pó em partes específicas da casa, posso perguntar se está chovendo dentro de casa, e posso até perguntar quando foi a última vez que trocamos a fralda do nosso bebê.
Ter uma IA conectada a um motor de busca pra responder perguntas no dia a dia é algo bem útil também. Nada que vá mudar a sua vida, mas vem bem a calhar de tempos em tempos.
Nem tudo são rosas, claro. Usar IAs remotas também significa que o tempo de resposta é maior, então acaba demorando mais para concluir um pedido.
Não tenho dados sobre isso, mas me parece que os servidores do Google Assistant, Siri e Alexa passam muito mais tempo no ar também. Passei um ano com a Siri e não lembro de qualquer indisponibilidade. Já o Claude fica fora do ar dia sim, dia não. Não chegou a me afetar ainda, mas a possibilidade é bem maior.
Privacidade e controle
O dispositivo oferece o nível de privacidade que te deixa confortável. Pode-se conectar a uma IA remota se quiser, mas também pode usar IAs locais ou deixar o Home Assistant lidar com tudo sem conexões externas.
O interruptor físico, que corta energia dos microfones, é um diferencial. Não é software desligando o microfone; a conexão do microfone é cortada fisicamente.
O custo real
O dispositivo custa cerca de US$ 59, valor competitivo com o de outros assistentes. Mas aqui vem a realidade: apesar do dispositivo ser barato, o investimento acaba sendo maior para deixar ele realmente interessante. Privacidade e controle custam caro.
Usar uma IA remota significa que pagar por cada interação com a assistente, o que é um problema. Dependendo da sua configuração, você paga para gerar a voz também.
Dito isso, modelos como o Claude Haiku ou o Gemini Flash são rápidos e muito baratos. Dependendo do seu uso, o gasto mensal fica abaixo de US$ 2 (dois dólares).
Rodar IAs locais com o Ollama é a melhor opção em termos de privacidade e velocidade de resposta, mas para os padrões brasileiros é algo quase impossível, devido ao alto preço das placas de vídeo por aqui. Torna-se uma opção viável se você tiver um Mac Mini com Apple Silicon juntando poeira em casa.
IAs locais que podem usar ferramentas sem muitos erros precisam de mais recursos pra rodar, então, novamente, batemos na questão do custo. Uma Alexa da vida é mais barata no longo prazo, desconsiderando o custar oculto à privacidade.
A questão da música
Aqui as coisas ficam complicadas. Se você usa serviços de streaming pra escutar música, vai ficar na mão.
O suporte a músicas não é padrão, mas você pode adicionar usando um servidor Music Assistant e um script no Home Assistant para que o LLM consiga pesquisar a sua biblioteca e tocar músicas. O suporte a voz não é oficial ainda, é um hack que às vezes funciona, às vezes não, dependendo de como a IA preenche os campos necessários.
Por outro lado, é possível criar automações para tocar músicas aleatórias ou específicas, o que ajuda um pouco. Por exemplo, eu tenho uma automação para tocar um álbum aleatório, mas também tenho uma para tocar a trilha sonora do filme Kpop Demon Hunters (minha esposa está viciada).
A questão do áudio
Outro problema: conectar o assistente a uma caixa de som própria é quase obrigatório, já que o som do dispositivo é dos piores que já ouvi na vida. Péssimo mesmo. O alto-falante interno foi feito para reproduzir vozes, não música.
Poder usar caixas de som que você tem em casa é um recurso incrível para tocar música. A saída P2 com DAC dedicado permite áudio “lossless” em caixas externas. Se você já tem boas caixas de som em casa, essa desvantagem do Voice PE desaparece.
Conclusão
Se você pode rodar modelos de IA localmente, o Voice PE é o melhor assistente de voz do mercado. A combinação de privacidade, controle e flexibilidade é imbatível.
Se você só pode rodar tudo remotamente, não posso recomendá-lo no momento. O custo por interação, a latência e a dependência de serviços externos tiram muito do apelo do dispositivo.
Dito isso, esse é só um “preview” e as coisas tendem a melhorar. Todo dia novos modelos são lançados e fica cada vez mais fácil rodá-los localmente. Uma segunda versão, com microfones melhores e com o barateamento do hardware necessário para rodar IAs localmente, seria muito bem-vinda.
Eu usava o HomePod integrado ao Home Assistant há um bom tempo, mas comprei o Voice PE pra ter controle total sobre minha casa por voz. Os motivos foram vários, mas o principal foi poder controlar mais coisas, ter controle sobre a personalidade da assistente e poder conectar tudo em caixas de som de verdade.
No dia a dia, provavelmente algo em torno de 80% do que você pediria pra uma assistente de voz fazer é algo que outras assistentes já suportam.
Pro meu uso eu achei as desvantagens aceitáveis, ainda mais pra uma versão de “preview“. A avaliação pode variar para cada pessoa.
Para entusiastas de casas inteligentes que já usam o Home Assistant e querem participar do desenvolvimento de uma alternativa de código aberto às das big techs, é um ótimo momento para entrar. Para quem quer algo que “apenas funcione” como uma Alexa ou Google Home, é melhor esperar a versão final.
Muito legal o relato! Gostaria de saber mais de como se Home Assistant sabe quando vocês trocam a fralda do bebê ou quando chove dentro de casa. É por câmera?
Usamos um software chamado Baby Buddy pra registrar várias coisas da vida do bebê, inclusive troca de fraldas, e eu integrei ele no Home Assistant usando a API.
Quanto a chuva dentro de casa, temos um sensor de chuva Zigbee que detecta chuva e sensores nas janelas. Se o sensor tiver detectado chuva e a janela estiver aberta, 100% de chance de estar chovendo dentro, haha.