Salve, pessoal!

Tudo certo? Espero que sim!

Estava ouvindo um podcast sobre gerenciamento de projetos que acompanho há alguns bons anos (para quem tiver curiosidade é o 5 Minutes Podcast do Ricardo Vargas), nesse episódio em específico, (https://ricardo-vargas.com/podcasts/will-project-management-offices-pmo-survive-in-the-age-of-ai/), O Ricardo fala sobre os impactos que IA ira trazer para o gerenciamento de projetos e como poderíamos utilizar essas ferramentas, como o ChatGPT, para turbinar nossas entregas.

Sua reflexão é muito interessante, sugiro que ouçam o episódio, pois está incrível! 🙂

Pois bem, comecei a pensar em alguns pontos correlacionando com nosso contexto de dados, pois o futuro é integrar essas tecnologias de IA com nossos contextos internos, ou seja, o que temos documentado.

O Contexto

Inteligencias artificiais precisam de dados, isso é o combustível para que elas possam gerar uma resposta minimamente aceitável.

Sem um bom combustível, não é possível ter uma boa performance, ou a famosa máxima, “trash in, trash out“.

Um problema latente nas empresas é a falta de documentação (ou mesmo a ausência delas!), então imagine como essas IA’s podem ser treinadas com uma documentação ainda muito fraca?

Da perspectiva de dados, já temos algumas iniciativas que serão fundamentais no futuro, como, por exemplo, o Data Mesh ou ferramentas de catalogação de dados.

Mas serão elas suficientes?

O Problema

O nível de resposta obtido pela IA será o mesmo que foi documentado. E não sei se isso é suficiente para uma resposta adequada que acelere o desenvolvimento de um novo pipeline ou melhore o entendimento da equipe sobre algum fluxo existente.

Vamos imaginar a documentação de uma tabela fictícia:

Agora imaginemos que estamos querendo saber mais sobre a tabela de produtos, pois usaremos em algum novo Data Product.

Caso queiramos informações básicas, provavelmente a resposta será satisfatória.

Perguntas do tipo, “qual a chave da tabela?” serão respondidas com tranquilidade.

Mas ao perguntarmos coisas mais complexas que envolvam conceitos de negócio, a resposta não ajudará muito, por exemplo:

Como eu pego a última versão do produto da tabela de produtos?”

No melhor dos casos, a IA poderia analisar a descrição e tentar prover algum contexto de como realizar isso.

Mitigações

Certo, mas o que podemos fazer?

Na verdade, o que poderíamos fazer para melhorar nossas respostas é prover o contexto adequado para a tabela, coisas como, riscos, sistemas de origem, regras de negócios, etc. são informações que podem ajudar.

Todas as informações que enriqueçam nossa documentação para além de um simples catalogo serão uteis para que a IA possa nos responder adequadamente.

Imagine a mesma tabela com a adição de conceitos da tabela:

  • Sistema de Origem – XPTO

  • Time Responsável Produtos

  • Conceito 1 – Os produtos ativos devem ter o filtro status = 1 e a maior data de atualização.

  • Conceito 2 – Quando realizar o cruzamento da tabela de produtos com a tabela de vendas, lembrar de usar as colunas dt_insercao e dt_atualizacao para que o valor esteja correto no histórico.

      Muito provavelmente iremos ter respostas bem melhores do que apenas a do catálogo.

      Talvez algo como um commit log junto ao catálogo de dados que demonstre, mesmo de forma textual, os conceitos e utilizações da tabela, pode ser uma opção interessante para melhorarmos nossa qualidade de resposta de integrações com as IA’s que estão chegando.

      Conclusão

      Meu intuito era compartilhar essa preocupação, pois sei que logo nosso espaço estará preenchido por esses tipos de ferramentas, e poderemos melhorar bastante nossa velocidade se simplesmente melhorarmos a forma com a qual fazemos a catalogação hoje.

      É isso, pessoal! Tudo de bom!

      🙂


      Jefferson Soares

      Olá! Sou Jefferson. Trabalho com: Dados, Dashboards, SQL, SAS, Python e muito mais! Criei esse cantinho para postar alguns conhecimentos. :)

      0 0 votos
      Article Rating
      Inscrever-se
      Notificar de
      guest
      0 Comentários
      mais antigos
      mais recentes Mais votado
      Feedbacks embutidos
      Ver todos os comentários