- Design, develop, and enhance CV, NLP, Speech, LLM and Multimodal
models for diverse applications including customer support, chatbots, RAG and automated assistance tools.
- Conduct research, experiments and evaluation to advance the state-of-the-art in CV, NLP, Speech, LLM and Multimodal models.
- Collect, preprocess, and curate large datasets for training and evaluation of CV, NLP, Speech, LLM and Multimodal models.
- Implement data augmentation and enhancement techniques to improve model robustness.
- Deploy and maintain models in production environments, ensuring high availability and performance.
- Develop APIs and services to make CV, NLP, Speech, LLM and Multimodal models capabilities accessible to other teams and applications.
- Implement monitoring and logging for deployed models to ensure performance, reliability, and scalability.
- Conduct regular evaluations and fine-tuning of models based on feedback and new data.
- Document methodologies, experiments, and results comprehensively.
- Communicate findings and progress to stakeholders through reports and presentations.
- Stay updated with the latest advancements in NLP, LLM, and AI research.
- Contribute to the continuous improvement of the team's processes, tools, and methodologies.
- Thiết kế, phát triển và cải tiến các mô hình CV, NLP, Speech, LLM và Đa phương thức cho nhiều ứng dụng khác nhau bao gồm hỗ trợ khách hàng, chatbot, RAG và các công cụ hỗ trợ tự động.
- Tiến hành nghiên cứu, thử nghiệm và đánh giá để nâng cao trình độ tiên tiến trong các mô hình CV, NLP, Speech, LLM và Đa phương thức.
- Thu thập, xử lý trước và quản lý các tập dữ liệu lớn để đào tạo và đánh giá các mô hình CV, NLP, Speech, LLM và Đa phương thức.
- Triển khai các kỹ thuật tăng cường và nâng cao dữ liệu để cải thiện độ mạnh mẽ của mô hình.
- Triển khai và duy trì các mô hình trong môi trường sản xuất, đảm bảo tính khả dụng và hiệu suất cao.
- Phát triển các API và dịch vụ để các nhóm và ứng dụng khác có thể truy cập vào các khả năng của mô hình CV, NLP, Speech, LLM và Đa phương thức.
- Triển khai giám sát và ghi nhật ký cho các mô hình đã triển khai để đảm bảo hiệu suất, độ tin cậy và khả năng mở rộng.
- Tiến hành đánh giá thường xuyên và tinh chỉnh các mô hình dựa trên phản hồi và dữ liệu mới.
- Ghi lại các phương pháp, thí nghiệm và kết quả một cách toàn diện.
- Truyền đạt các phát hiện và tiến độ cho các bên liên quan thông qua các báo cáo và bài thuyết trình.
- Cập nhật những tiến bộ mới nhất trong nghiên cứu NLP, LLM và AI.
- Góp phần cải tiến liên tục các quy trình, công cụ và phương pháp của nhóm.
- BS or MS in Computer Science, Data Science or a related field. Ph.D. preferred.
- At least 02 years in the field of AI, Machine Learning, Computer Vision (CV), Natural Language Processing (NLP), Speech Processing.
- Experience in speech processing (Speech-to-Text & Text-to-Speech) is a STRONG PLUS.
- Experience in Hugging Face Transformers is a STRONG PLUS.
- Proven experience with large language models (e.g., BERT, T5, LLama, Qwen) and deep learning frameworks (e.g., TensorFlow, PyTorch, Hugging Face).
- Experience with cloud platforms (e.g., AWS, GCP, Azure) and containerization tools (e.g., Docker, Kubernetes, CI/CD) and version control tools (eg., Git).
- Strong programming skills in Python, R, C/C++.
- Have worked with LLM tools like LangChain, LLamaIndex, RAG
- Experience in deploying models with TensorRT, ONNX, Ollama, vLLM, LLamaCPP.
- Strong analytical and problem-solving skills.
- Strong teamwork and independent working capabilities.
- Open-minded, creative thinker, and adaptable to dynamic work environments.
- Good English, priority given to candidates who can read English documents.
- Cử nhân hoặc Thạc sĩ Khoa học Máy tính, Khoa học Dữ liệu hoặc lĩnh vực liên quan. Ưu tiên ứng viên có bằng Tiến sĩ.
- Có ít nhất 02 năm kinh nghiệm trong lĩnh vực AI, Machine Learning, Computer Vision (CV), Natural Language Processing (NLP), Speech Processing.
- Kinh nghiệm trong xử lý giọng nói (Chuyển giọng nói thành văn bản và Chuyển văn bản thành giọng nói) là MỘT ĐIỂM MẠNH.
- Kinh nghiệm trong Hugging Face Transformers là MỘT ĐIỂM MẠNH.
- Kinh nghiệm đã được chứng minh với các mô hình ngôn ngữ lớn (ví dụ: BERT, T5, LLama, Qwen) và các khuôn khổ học sâu (ví dụ: TensorFlow, PyTorch, Hugging Face).
- Kinh nghiệm với các nền tảng đám mây (ví dụ: AWS, GCP, Azure) và các công cụ chứa (ví dụ: Docker, Kubernetes, CI/CD) và các công cụ kiểm soát phiên bản (ví dụ: Git).
- Kỹ năng lập trình mạnh mẽ bằng Python, R, C/C++.
- Đã làm việc với các công cụ LLM như LangChain, LLamaIndex, RAG
- Kinh nghiệm triển khai các mô hình với TensorRT, ONNX, Ollama, vLLM, LLamaCPP.
- Kỹ năng phân tích và giải quyết vấn đề mạnh mẽ.
- Khả năng làm việc nhóm và làm việc độc lập mạnh mẽ.
- Tư duy cởi mở, sáng tạo và thích nghi với môi trường làm việc năng động.
- Tiếng Anh tốt, ưu tiên Ứng viên có khả năng đọc tài liệu Tiếng Anh.
- Salary is negotiated according to the candidate's ability when discussing directly
- Full participation in social insurance and health insurance
- Periodic health check-ups
- Holiday bonuses, 13th month salary according to regulations
- Participate in Teambuilding and cultural and sports events of Erax and the Group
- Participate in all regimes and policies according to current laws.
- Mức lương thỏa thuận theo năng lực khi ứng viên trao đổi trực tiếp
- Tham gia BHXH, BHYT đầy đủ
- Khám sức khỏe định kỳ
- Thưởng các ngày lễ, lương tháng 13 theo quy định
- Tham giaTeambuilding và các sự kiện văn hóa, thể dục thể thao chung của Erax và Tập Đoàn
- Được tham gia đầy đủ các chế độ, chính sách theo quy định của pháp Luật hiện hành.