O que significa UnhealthyService?

Fala Devs! Tudo bem?

Alguém sabe o que significa a mensagem abaixo e se devo fazer algo?

Esse erro não está mais acontecendo, mas retornou algumas vezes enquanto uma app consultava o endpoint dos PickupPoints.

{"code":"UnhealthyService","message":"Service account-app-name-0-1-10-beta-0-87d7f7ce0431239 is unhealthy","source":"Vtex.Kube.Router","requestId":"65c3d25288954293af5dac0eb5c4c708"}

Obrigado desde já!

Oi @andremiani de boas?

Em outras palavras eu chutaria que “o serviço não está respondendo”, algo do gênero e está relacionado ao core do framework da VTEX.

Eu já evidenciei esse erro abrindo o painel administrativo e/ou site-editor. Em outros casos foi acusado erro geral - via servidor - publicado na página de status.

No seu caso pode ter sido momentâneo em que a API não respondeu para o APP.

Isso é só uma suspeita, mas o @georgebrindeiro ou @zerebelo poderia até confirmar melhor.

Abs,
Estevão.

1 Like

Olá @estevao_santos, tudo bom?

Muito obrigado pela sua contribuição.

Aproveito para comentar que também já criei um ticket no suporte da VTEX para escutar o parecer deles sobre esse erro code UnhealthyService

Hoje já aconteceu comigo mais de uma vez. Mas, por sorte esse problema foi identificado apenas em uma conta, já que este app é utilizado pelo checkout de 25 lojas.

1 Like

Esse erro acontece quando um serviço no VTEX IO está inativo há muito tempo, o que gera um problema de cold start. Ou seja, demora um tempo para ele ser reativado e funcionando normalmente.

Para mitigar esse problema, você pode tentar alterar o TTL do serviço ou incorporar retries no cliente que faz essas chamadas. Suportamos essa configuração nativamente para chamadas de app para app, como você pode ver nesse exemplo.

3 Likes

Olá @georgebrindeiro, obrigado pela ajuda. Tudo bem contigo?

Até imaginei essa questão do ‘cold start’ típico dos servidores lambdas, porém como hora funciona e hora não funciona, no mesmo dia, as vezes com poucos minutos ou até mesmo poucos segundos entre as tentativas acabei descartando essa questão.

Fora que essa questão começou de uma hora para outra e das cerca de 25 contas que utilizam esse app, apenas uma conta está tendo este comportamento.

Segue a configuração atual do meu service:

{
  "memory": 256,
  "ttl": 60,
  "timeout": 60,
  "minReplicas": 2,
  "maxReplicas": 2,
  "workers": 2,
  "routes": {
    "pickuppoints": {
      "path": "/_v/pickuppoints",
      "public": true
    }
  }
}

Vou experimentar os retries, porém ainda assim, fica a dúvida do porque esse erro começar a acontecer com tanta frequência em apenas uma conta e nenhuma notificação desse erro em nenhuma outra conta.

Muito obrigado. Qualquer informação é bem-vinda.

1 Like

This topic was automatically closed 24 hours after the last reply. New replies are no longer allowed.