
Otimizando o processo da sua cadeia de suprimentos usando dados de streaming em tempo real
Os dados em tempo real têm características únicas que os separam de outros tipos de dados usados em modelos de aprendizado de máquina.
Uma tendência crescente entre os fabricantes é usar dados de streaming para mitigar gargalos experimentados no gerenciamento da cadeia de suprimentos. Simplificando, os dados de streaming são quaisquer dados gerados constantemente, geralmente por um grande número de fontes de dados, entregues simultaneamente. Exemplos de dados de streaming podem incluir arquivos de log criados a partir do uso de aplicativos da Web e/ou móveis, atividade por meio de comércio eletrônico, dados extraídos de mídias sociais ou dados transmitidos de dispositivos conectados.
Os insights de dados de streaming de IoT são especialmente úteis em um ambiente de fabricação, pois podem dar suporte ao monitoramento de equipamentos/mão de obra, melhoria de operações/mão de obra, gerenciamento de materiais e otimização da cadeia de suprimentos.
Esse tipo de dados precisa ser analisado um a um e peça por peça em intervalos de tempo em constante mudança, para uma variedade de análises diferentes, como amostragem, correlações e filtragem. Os dados extraídos desses tipos de análises fornecem aos fabricantes transparência em várias facetas de sua cadeia de suprimentos. Ele também fornece informações sobre a atividade do cliente, o que permite que eles respondam mais rapidamente às tendências emergentes. Ele pode permitir que os fabricantes acompanhem as mudanças nas reações dos clientes às suas marcas e/ou produtos, por exemplo, analisando constantemente as redes sociais para ajustar os cronogramas de produção à medida que as oportunidades se apresentam. Também permite uma priorização mais rápida de orçamentos para produtos de alta demanda, ao mesmo tempo em que elimina os custos de produção e armazenamento de produtos que não são mais procurados.
Desafios ao usar dados de streaming com modelos de aprendizado de máquina
Os dados em tempo real têm características únicas que os separam de outros tipos de dados usados em modelos de ML. Normalmente, ao lidar com modelos de ML, os dados são chamados de “dados em lote”. Com os dados de lote, todas as informações estão disponíveis desde o início e já estão salvas. Por outro lado, os dados de streaming são gerados em estilo consecutivo, que também pode ser temporário por definição. Portanto, os fluxos de dados geralmente carregam essas características:
● Seu sistema não controla a ordem em que você recebe os dados
● Os fluxos de dados não têm restrições de tamanho
● Depois que um componente do fluxo de dados é analisado, ele pode ser abandonado
As características únicas dos dados de streaming também são responsáveis pelos obstáculos que apresentam quando os modelos de ML analisam os dados. A estabilidade dos dados de lote permite que eles sejam pesquisados completamente e partes específicas dos dados podem ser recuperadas a qualquer momento. No entanto, como os dados de streaming são temporários, eles devem ser pesquisados constantemente pelo algoritmo de ML, sobrecarregando ainda mais o sistema que está sendo usado. Por exemplo, com uma média de 2 bilhões de transações de comércio eletrônico por ano, o algoritmo médio de mineração de fluxo de dados está compilando dados de cerca de 3.800 transações por minuto. Portanto, o processamento em lote (embora mais lento) tende a ser usado no gerenciamento da cadeia de suprimentos, pois pode não ser viável lidar com grandes volumes de dados nessas velocidades sem expandir a infraestrutura computacional.
Além disso, dado o tamanho irrestrito dos dados de streaming, a quantidade transmitida junto com a velocidade com que é entregue pode causar uma grande pressão nos limites do sistema que está sendo usado. Em particular, como essa tensão afeta a memória disponível em um determinado sistema, pode não ser prático salvar componentes de seus dados de streaming porque a quantidade de dados que passa pelo stream geralmente não é previsível.
Outra restrição é a potência do processador e a velocidade com que os componentes de dados chegam. Os algoritmos de mineração de fluxo de dados geralmente exigem uma estrutura rápida e mínima (computacionalmente falando).
Soluções potenciais para integrar dados de streaming em modelos de ML
Para fabricantes que não empregam equipes de desenvolvedores dedicadas a mitigar os problemas acima, projetar um processo de cadeia de suprimentos que possa alavancar adequadamente um modelo de ML é uma tarefa quase impossível. A quantidade de serviços necessários para trabalhar em conjunto para aproveitar o poder do streaming de dados imitaria as responsabilidades de um controlador de tráfego aéreo, onde é muito fácil ocorrer um atraso. Acrescente a isso a tecnologia disponível hoje para utilizar dados de streaming é amigável apenas para empresas com uma equipe de desenvolvedores dedicada a esse problema. Para quem não tem esses recursos, é uma questão constante que precisa de atenção.
Os fabricantes devem considerar mecanismos de computação de modelo de ML projetados especificamente para tarefas computacionais em tempo real e de alto volume, como mineração de fluxo de dados. A utilização de um mecanismo de tempo de execução evento a evento para análise de streaming é ideal para o fluxo constante de dados da cadeia de suprimentos. Ao mesmo tempo, a plataforma eficiente e de baixo esforço também permite custos de computação reduzidos, apesar do tamanho do seu fluxo de dados, resolvendo um problema que atormentou a última milha do processo de ML. O design da plataforma permite a integração perfeita em um ecossistema de dados existente. Agora, com essa ferramenta, os cientistas de dados podem desenvolver, monitorar e otimizar modelos para streaming de dados com relativa facilidade.
Usando uma das plataformas mais recentes do mercado que proporciona uma redução no tempo de implantação com inferência mais rápida, os modelos de ML permitem análises mais rápidas. Eles também usam muito menos infraestrutura do que as implantações que usam plataformas mais antigas. Os tipos de implantações de modelo de streaming que exigiriam GPUs para fornecer o desempenho desejado agora podem ser executados com sucesso em mais CPUs padrão, o que resultou em economias significativas para os fabricantes.
Juntos, esses aprimoramentos tornam muito mais prático para os fabricantes otimizar sua cadeia de suprimentos com dados de streaming.
Fonte: Smart industry
Notícias do setor industrial você encontra aqui no portal da indústria brasileira, Indústria S.A.