Científico de Datos - INDIA Hybrid - US

Científico de Datos - INDIA

Tiempo completo • Hybrid - US
Puesto: Científico de Datos - INDIA
Ubicación: Hyderabad, INDIA

*Los consultores locales de INDIA son elegibles.

Categoría: Ciencia de Datos – Datos Estructurados / Datos de Texto (PLN y GenIA)


Sobre el puesto

Buscamos un Científico de Datos altamente cualificado (con 3–7 años de experiencia) para unirse a nuestro equipo y trabajar en dos grandes dominios de ciencia de datos:

  1. Datos estructurados (80–90%) – Análisis predictivo, previsiones, estimación de costes, modelado de probabilidad y pipelines de aprendizaje automático orientados a lotes.
  2. Texto / Datos no estructurados (NLP y GenAI) – Construcción de sistemas en tiempo real de baja latencia usando aprendizaje profundo, LLMs, ingeniería de prompts y frameworks de IA agente.
Este puesto requiere una sólida experiencia en procesamiento de Big Data, herramientas modernas de aprendizaje automático y la capacidad de construir soluciones de ciencia de datos escalables y listas para producción.

Responsabilidades clave

Datos estructurados – Aprendizaje Automático y Analítica

  • Construir, desplegar y optimizar modelos de aprendizaje automático para análisis predictivo, predicción, clasificación y regresión.
  • Realizar ingeniería de características a gran escala utilizando herramientas de PySpark y Big Data.
  • Trabajar en pipelines por lotes, versionado de modelos y seguimiento de experimentos.
  • Desarrollar modelos de estimación de costes y de riesgo/verosimilitud utilizando técnicas estadísticas y de aprendizaje automático.
Datos de texto / PLN / GenAI

  • Construye pipelines de PLN usando frameworks de aprendizaje profundo como PyTorch, TensorFlow o similares.
  • Desarrollar sistemas de inferencia en tiempo real y baja latencia para clasificación de texto, incrustaciones, búsqueda semántica, resumen y recuperación.
  • Crea prompts, gráficos de contexto y flujos de trabajo agentes para sistemas basados en LLM.
  • Aplica conocimientos de ingeniería de prompts, ingeniería de contexto y marcos de agentes autónomos a los sistemas de producción.
Ingeniería Básica de Ciencia de Datos y MLOps

  • Trabaja en Databricks para ETL, ingeniería de características, formación en ML y orquestación.
  • Utiliza los servicios de Azure para el despliegue de modelos, canalizaciones de datos e infraestructura.
  • Colaborar usando flujos de trabajo basados en Git; Aprovecha herramientas como GitHub Copilot, Claude Code, etc.
  • Implementar monitorización de modelos, observabilidad, detección de deriva y seguimiento del rendimiento.
Habilidades y experiencia requeridas

✅ Habilidades básicas

  • Amplia experiencia práctica con Databricks (Delta Lake, MLflow, Orquestación de Trabajos).
  • Excelentes habilidades PySpark para procesamiento distribuido de datos a gran escala.
  • Proficiency in Azure cloud services (ADF, Azure ML, AKS, Databricks on Azure).
  • Sólido conocimiento de algoritmos de aprendizaje automático, métodos estadísticos y análisis de datos.
  • Experiencia con frameworks de aprendizaje profundo :
    • PyTorch
    • TensorFlow
    • Transformers (HuggingFace)
  • Experiencia con monitorización de modelos y observabilidad de aprendizaje automático.
  • Capacidad para escribir código limpio y optimizado y aprovechar asistentes de código con IA.
✅ Habilidades específicas de PLN / GenAI

  • Ingeniería de prompts (prompts de tarea, cadena de pensamiento, llamada a herramientas, prompts de recuperación).
  • Ingeniería de contexto (canalizaciones de recuperación, RAG, gestión de memoria, estructuración de contexto).
  • Conocimiento de frameworks agenticos basados en LLM (LangChain, Semantic Kernel, CrewAI, AutoGen, etc.).
  • La experiencia con bases de datos vectoriales y modelos de embedding es un punto a favor.
Bueno tener habilidades

  • Experiencia con contenedores (Docker, Kubernetes, AKS).
  • Experiencia desplegando modelos en producción (APIs REST, endpoints en tiempo real).
  • Conocimiento de tecnologías de streaming (Kafka, EventHub, Spark Streaming).
  • Comprensión de CI/CD para ML (Azure DevOps / GitHub Actions).
Quién eres

  • Un solucionador de problemas que se siente cómodo trabajando tanto con datos estructurados como no estructurados.
  • Alguien que disfruta usando herramientas modernas de IA para acelerar el desarrollo.
  • Un científico de datos que escribe código limpio y de calidad de producción.
  • Un colaborador que destaca en equipos multifuncionales y entornos dinámicos.

Opciones flexibles de teletrabajo disponibles.

Somos un empleador con igualdad de oportunidades y todos los candidatos calificados recibirán consideración por el empleo sin distinción de raza, color, religión, sexo, origen nacional, estado de discapacidad, estado de veterano protegido o cualquier otra característica protegida por la ley.





Aplicar aquí.

* campos requeridos

Ubicación
Or
Or

Información de Empleo de Igualdad de Oportunidades en los EE. UU. (La finalización es voluntaria)

Somos un empleador que ofrece igualdad de oportunidades y todos los solicitantes calificados recibirán consideración para un empleo sin distinción de raza, color, religión, sexo, origen nacional, estado de discapacidad, estado de veterano protegido o cualquier otra característica protegida por la ley.

Se le brinda la oportunidad de proporcionar la siguiente información para ayudarnos a cumplir con los registros federales, estatales de igualdad de oportunidades de empleo / Acción afirmativa, informes y otros requisitos legales.

La cumplimentación del formulario es totalmente voluntaria. Sea cual sea su decisión, no se considerará en el proceso de contratación o posteriormente. Cualquier información que proporcione será registrada y mantenida en un archivo confidencial.

Formulario CC-305
Número de Control OMB 1250-0005
Expira el 30/04/2026

¿Por qué se le pide que rellene este formulario?

Somos un contratista o subcontratista federal. La ley nos obliga a ofrecer igualdad de oportunidades de empleo a las personas con discapacidad cualificadas. Nuestro objetivo es que al menos el 7% de nuestros trabajadores sean personas con discapacidad. La ley dice que debemos medir nuestro progreso hacia este objetivo. Para ello, debemos preguntar a los solicitantes y a los empleados si tienen o han tenido alguna discapacidad. Las personas pueden convertirse en discapacitadas, por lo que debemos hacer esta pregunta al menos cada cinco años.

Rellenar este formulario es voluntario y esperamos que decida hacerlo. Su respuesta es confidencial. Nadie que tome decisiones de contratación la verá. Su decisión de rellenar el formulario y su respuesta no le perjudicarán en modo alguno. Si desea obtener más información sobre la ley o este formulario, visite el sitio web de la Oficina de Programas de Cumplimiento de Contratos Federales (OFCCP) del Departamento de Trabajo de EE.UU. en www.dol.gov/ofccp.

¿Cómo saber si tiene una discapacidad?

Una discapacidad es una condición que limita sustancialmente una o más de sus "actividades vitales principales". Si tiene o ha tenido alguna vez una afección de este tipo, usted es una persona con discapacidad. Las discapacidades incluyen, pero no se limitan a:

  • Trastorno por consumo de alcohol u otras sustancias (sin consumir drogas ilegalmente en la actualidad)
  • Trastorno autoinmune, por ejemplo, lupus, fibromialgia, artritis reumatoide, VIH/sida
  • Ceguera o problemas de visión
  • Cáncer (pasado o presente)
  • Enfermedad cardiovascular o del corazón
  • Enfermedad celíaca
  • Parálisis cerebral
  • Sordera o dificultades auditivas graves
  • Diabetes
  • Desfiguración, por ejemplo, desfiguración causada por quemaduras, heridas, accidentes o trastornos congénitos
  • Epilepsia u otro trastorno convulsivo
  • Trastornos gastrointestinales, por ejemplo, enfermedad de Crohn, síndrome del intestino irritable
  • Discapacidad intelectual o del desarrollo
  • Enfermedades mentales, por ejemplo, depresión, trastorno bipolar, trastorno de ansiedad, esquizofrenia o trastorno de estrés postraumático
  • Ausencia total o parcial de miembros
  • Problemas de movilidad que requieran el uso de una silla de ruedas, un escúter, un andador, una pierna ortopédica u otros dispositivos de apoyo
  • Afección del sistema nervioso, por ejemplo, migrañas, enfermedad de Parkinson, esclerosis múltiple (EM)
  • Neurodivergencia, por ejemplo, trastorno por déficit de atención con hiperactividad (TDAH), trastorno del espectro autista, dislexia, dispraxia u otras dificultades de aprendizaje
  • Parálisis parcial o total (por cualquier causa)
  • Afecciones pulmonares o respiratorias, por ejemplo, tuberculosis, asma, enfisema
  • Baja estatura (enanismo)
  • Lesión cerebral traumática

DECLARACIÓN PÚBLICA DE CARGA: De acuerdo con la Ley de Reducción de Trámites de 1995, ninguna persona está obligada a responder a una recopilación de información a menos que dicha recopilación muestre un número de control OMB válido. Esta encuesta debería completarse en unos 5 minutos.

Si cree que pertenece a alguna de las categorías de veteranos protegidos que figuran a continuación, indíquelo haciendo la selección adecuada. Como contratista del gobierno sujeto a la Ley de Asistencia para el Reajuste de Veteranos de la Era de Vietnam (VEVRAA), solicitamos esta información para medir la efectividad de los esfuerzos de alcance y reclutamiento positivo que llevamos a cabo de conformidad con VEVRAA. La clasificación de las categorías protegidas es la siguiente:

Un "veterano discapacitado" es uno de los siguientes: un veterano de los servicios militares, terrestres, navales o aéreos de los EE. UU. Que tiene derecho a una indemnización (o quién, salvo el pago militar jubilado, tendría derecho a una indemnización) según las leyes administradas por el Secretario de Asuntos de Veteranos; o una persona que fue dada de alta o liberada del servicio activo debido a una discapacidad relacionada con el servicio.

Un "veterano recientemente separado" se refiere a cualquier veterano durante el período de tres años que comienza en la fecha de la descarga o liberación de dicho veterano del servicio activo en el servicio militar, terrestre, naval o aéreo de los EE. UU.

Un "veterano de tiempo de guerra en servicio activo o insignia de campaña" significa un veterano que estuvo en servicio activo en el servicio militar, terrestre, naval o aéreo de los EE. UU. Durante una guerra o en una campaña o expedición para la cual se ha autorizado una insignia de campaña según las leyes. administrado por el Departamento de Defensa.

Un "veterano de la medalla del servicio de las Fuerzas Armadas" significa un veterano que, mientras estaba en servicio activo en el servicio militar, terrestre, naval o aéreo de los EE. UU., participó en una operación militar de los Estados Unidos por la cual se otorgó una medalla de servicio de las Fuerzas Armadas 12985.

If no code provided, add their name instead.