Continuamos a ouvir dos clientes que eles veem o imenso valor e a importância da inteligência artificial (IA), da IA generativa, da pesquisa vetorial e da computação de borda. Essas tecnologias estão se tornando mais essenciais para coletar dados e fornecer insights acionáveis. Ao mesmo tempo, continua a haver uma rápida expansão dos dispositivos de IoT, com decisões sendo tomadas em tempo real com base no fluxo de dados dos sensores. 

Muitas organizações estão prestes a mergulhar totalmente na integração dessas tecnologias para que possam proporcionar uma experiência aprimorada ao cliente. Elas estão usando a IA como um meio de atingir as metas de seus aplicativos, garantindo que eles sejam sempre rápidos, disponíveis, capazes de interagir em tempo real e de se envolver no contexto.

As empresas estão entusiasmadas e hesitantes em relação à IA

Embora o entusiasmo com as possibilidades da IA seja palpável, as empresas estão adotando uma abordagem cautelosa. Essas organizações hesitam em relação à segurança dos dados, à conformidade e às preocupações legais com relação ao uso da IA. Elas continuam avaliando a melhor maneira de aproveitar e governar os aplicativos alimentados por IA. Embora ainda haja certos aspectos de privacidade, segurança e precisão a serem resolvidos, está claro que as possibilidades potenciais que podem ser desbloqueadas são intrigantes demais para serem deixadas de lado.

A IA requer dados confiáveis

Os dados são a força vital para o treinamento de modelos de IA. Quanto mais dados atuais, limpos e confiáveis puderem ser fornecidos aos LLMs, mais confiáveis serão as respostas. E quanto mais dados você fornecer aos modelos de IA, mais precisos eles se tornarão. Como e onde você processa os dados tem implicações sobre a velocidade e a disponibilidade dos aplicativos alimentados por IA.

Utilizar a computação de borda para melhorar a velocidade e a disponibilidade

Se você armazena e processa dados na nuvem, pode ter dificuldades com a velocidade e a disponibilidade para dispositivos móveis. Se for uma linha de visão fácil de volta aos pontos de acesso, pode ser tranquilo, mas passar por celular/5G pode ser um problema se você estiver tentando fazer vídeo e análise ao mesmo tempo. É necessária uma largura de banda significativa para ir da nuvem até a borda e vice-versa, especialmente em áreas onde a conectividade é um problema, como estádios lotados, navios de cruzeiro, aviões e para trabalhadores de campo.

O Couchbase fornece um banco de dados da nuvem para a borda, juntamente com a pesquisa vetorial, para integração direta com modelos de IA na borda. Isso dá aos desenvolvedores a capacidade de armazenar e processar dados na nuvem (Capela) e em dispositivos com um banco de dados incorporado (Couchbase Lite). Tbanco de dados do Couchbase pode estar próximo ao local onde você vai usá-lo, como uma loja de varejo, um centro de distribuição ou um hospital. Ambos suportam pesquisa vetorial e sincronizam automaticamente entre dispositivos e até a nuvem. 

Capella App Services

Usar os fundamentos da computação de borda para processar os dados localmente significa muito menos dependência da nuvem e da conexão com a Internet. Colocar o banco de dados no próprio dispositivo (telefone, tablet, quiosque, PDV, dispositivos de IoT) ajuda os clientes a alcançar a disponibilidade de 100% e tempos de resposta garantidos para a pesquisa de vetores.

Exemplos de pesquisa vetorial em ação

Um exemplo de pesquisa vetorial em ação é no caixa automático do supermercado, quando se trata de itens que não podem ser escaneados. O processo atual consiste em digitar o item, selecionar o item certo na tela e embalá-lo. Com a pesquisa vetorial, a capacidade de encontrar itens por meio da pesquisa semântica visual inverte esse paradigma. Você colocaria o item no balcão, a câmera o escanearia e reconheceria, e então você o embalaria. Isso reduz um processo de 10 a 20 segundos para 2 segundos. A princípio, esses números parecem pequenos, mas Ao processar longas filas de clientes em supermercados ou centenas de passageiros que entram em um aeroporto ou hospital, esses números podem aumentar rapidamente.

A pesquisa vetorial e o reconhecimento de imagens em dispositivos móveis também terão um grande impacto. Fazer pesquisas de itens com base no próprio item funcionará muito melhor do que os códigos de barras. Enquanto os códigos de barras podem desbotar, enrugar e ser adulterados com o tempo, a pesquisa vetorial reconhece o próprio item e acelera o processo, o que é melhor tanto para os clientes quanto para os varejistas.

NoSQL database with mobile vector search

Outro exemplo disso em ação são os sinistros de seguro. Um segurado poderia tirar uma foto de um dano ocorrido em seu carro e descobrir rapidamente quais peças precisarão ser consertadas e para qual oficina ele pode ser levado. Há inúmeros casos de uso em potencial para pesquisa de vetores e imagens.

Vetores de linguagem natural

Os LLMs são excelentes na produção de vetores a partir de linguagem natural. O áudio fornece outro mecanismo para injetar mais contexto para o que o usuário da pesquisa de vetores está tentando obter, o que aumenta a precisão. A pesquisa e as consultas são bastante rigorosas, mas os vetores oferecem mais flexibilidade. 

Um exemplo disso em ação é que, em vez de procurar um item específico, você poderia dizer: "Vou fazer o jantar hoje, gosto de comida italiana, dois adultos e três crianças virão aqui, o que você recomendaria que eu fizesse com os ingredientes que tenho em mãos?" Você pode ser muito mais detalhado e preciso quando pode conversar naturalmente com o sistema por meio de áudio com LLMs e pesquisa vetorial.

Conclusão

A pesquisa vetorial e a computação de borda são recursos realmente transformadores. A infraestrutura de borda será uma parte importante de muitas soluções à medida que a necessidade de velocidade e processamento localizado aumentar. Os líderes de TI devem trabalhar com os líderes de negócios para ajudá-los a visualizar e entender o que é possível. A capacidade de conceber casos de uso em potencial e socializá-los na organização é uma função essencial para a TI e é extremamente benéfica para a organização.

Autor

A ordem da postagem em relação a outras postagens. Matt Spillar - Gerente de marketing de produto

Posição vertical a partir do topo para iniciar o corte como uma porcentagem da altura da imagem.