Skip to content
View serg-stone's full-sized avatar
🎯
Focusing
🎯
Focusing
  • Moscow

Block or report serg-stone

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
serg-stone/README.md

Добро пожаловать👋

Специальность

Промт-инженер, специалист по ИИ, архитектор ИИ решений, инженер данных, техлид интеграций, аналитик по оптимизации затрат.

Задачи

Интеграция ИИ в бизнес-процессы, автоматизация рабочих потоков, управление качеством данных, развертывание и мониторинг моделей, проектирование RAG-систем, безопасность и комплаенс.

Ключевая специализация промт-инженер, специалист по ИИ

Области

Нейронные сети, обработка текста, обработка изображений, обработка аудио, мультимодальные модели, RAG, генерация контента, интеграция через API, оркестрация, мониторинг, безопасность.

Методы

Токенизация, эмбеддинги, векторный поиск, дообучение, тонкая настройка.

Языки программирования

Языки

Python, JavaScript, C++, PHP, Assembler.

Скриптовые среды

Bash, PowerShell.

SQL-диалекты

PostgreSQL, MySQL, MS SQL, T-SQL.

Модели общего назначения (LLM)

Модели

GPT-4.1, GPT-4o, GPT-4o mini, GPT-3.5, Claude 3 Opus, Claude 3.5 Sonnet, Gemini 1.5 Pro, Gemini 1.5 Flash, Llama 3 8B, Llama 3 70B, Llama 3.1 405B, Qwen2 7B, Qwen2 72B, Qwen2.5 32B, DeepSeek-V2.

Мультимодальные и компьютерное зрение

Генерация изображений

Stable Diffusion 1.5, Stable Diffusion XL, Stable Diffusion 3, DALL·E 3, Kandinsky 3, Midjourney.

Аудио, речь и мультимедиа

Распознавание

Whisper, WhisperX.

Синтез речи

FastSpeech 2, VALL-E, ElevenLabs.

RAG и поиск

Компоненты

Векторизация, чанкинг, расширение запросов, фильтры, переранжирование, кэширование, цитирование.

Фреймворки

LangChain, LlamaIndex.

Векторные БД

Pinecone, Weaviate, Milvus, Qdrant, FAISS, Chroma, pgvector.

Реранкеры

Cohere rerank-3, bge-reranker-large, Jina-reranker-v2, cross-encoder/ms-marco-MiniLM-L-6-v2.

Оптимизация и ускорение моделей

Инструменты

XLA, DeepSpeed, Megatron-LM, ZeRO, llama.cpp.

Подходы

Квантование 8-бит, квантование 4-бит, дистилляция, графовые оптимизации, шардинг.

Фреймворки и экосистемы

Обучение

PyTorch, TensorFlow, Keras, Flax, Lightning, PyTorch Lightning, FastAI, Hugging Face Accelerate.

Разметка и данные

Datasets (HF), WebDataset.

Компьютерное зрение

OpenCV, Albumentations.

Инфраструктура и DevOps

Контейнеры

Docker, Docker Compose, Podman.

Оркестрация

Kubernetes.

Облачные платформы

Azure, Google Cloud.

Сети и балансировка

Nginx, Cloudflare.

Секреты и ключи

Azure Key Vault, Google Cloud KMS.

Наблюдаемость

OpenSearch, OpenTelemetry.

Хранение и обработка данных

Хранилища

PostgreSQL, MySQL, MariaDB, SQLite, ClickHouse, MongoDB.

Интеграция через API

Протоколы

REST, GraphQL, gRPC, WebSocket, WebRTC, SOAP.

Спецификации

OpenAPI, Swagger, gRPC-proto.

Аутентификация и авторизация

OAuth 2.0, API Keys.

Шлюзы

AWS API Gateway, Azure API Management, Cloud Endpoints.

CI/CD и управление конфигурациями

CI/CD

GitHub Actions, GitLab CI.

Управление версиями

Git, Git LFS.

Фронтенд и продуктовые интерфейсы

Фреймворки

React, Next.js.

Мониторинг качества и дрейфа

Метрики

Точность, полнота, F1, AUC-ROC, perplexity.

Аналитика

Amplitude, Google Analytics 4, Grafana.

Проектирование промтов и рабочих цепочек

Техники

zero-shot, few-shot, self-consistency, toolformer-подсказки, chain-of-thought, tree-of-thought, skeleton-of-thought, ReAct, Retrieval-Augmented Generation, function calling.

Инструменты

LangChain, LlamaIndex.

Токены и стоимость

tiktoken, TikTokenizer.

Управление проектами и документация

Инструменты

Jira, Confluence, Trello, Notion, Slack, Microsoft Teams.

Документация

Sphinx.

Бизнес-интеграции и RPA

CRM/Support

Zendesk.

RPA/BPM

strombpmn, Zeebe, n8n, Make.

Вычисления и аппаратные платформы

GPU

NVIDIA A10, A100, H100, L4, L40S, RTX 4090.

CPU

Intel Xeon.

Оптимизация

CUDA, cuDNN, OpenCL.

Пакетные менеджеры

pip, pipx.

Хранение знаний и документация в проектах

Форматы

Markdown, JSON, YAML, CSV, XML.

Нотации и онтологии

RDF, Schema.org.

Паттерны архитектуры

Подходы

Микросервисы, монолит, модульный монолит, событийная архитектура, брокер сообщений, DDD.

Кэширование и очереди

Redis.

Конфиденциальность и соответствие

Техники

Псевдонимизация, анонимизация, дифференциальная приватность, маскирование, контроль доступа.

Документация API и контрактное тестирование

Генерация

OpenAPI Generator, Swagger Codegen.

Тестирование

Postman.

Визуализация и BI

Инструменты

matplotlib.

BI-платформы

Power BI, Apache Superset.

Управление знаниями для RAG

Индексация

hybrid search, dense retrieval, Maximal Marginal Relevance, HNSW.

Предобработка

sentence splitting, recursive chunking, markdown-разбор, HTML-парсинг, таблицы.

Источники

Confluence, Google Drive, Notion, SharePoint, Git, базы данных.

Контроль версий моделей и данных

Артефакты

Hugging Face Hub.

Данные

Версионирование датасетов, хеширование, слежение за происхождением, сравнение сэмплов, аудит.

Производительность и масштабирование

Классические подходы

Горизонтальный масштаб, авто-масштаб, шардирование, репликация, кэш ответов, кэш эмбеддингов, дедупликация запросов.

Инструменты

Kubernetes HPA, Redis, Nginx.

Отчётность и контроль затрат ИИ

Метрики

Стоимость на 1k токенов, стоимость на один запрос, стоимость на пользователя, стоимость на документ, GPU-часы, утилизация.

Инструменты

FinOps dashboards, Kubecost, Infracost, Cloud Billing, Athena отчёты, BigQuery отчёты.

Продуктовые KPI для ИИ-функций

Показатели

Доля принятых ответов, время до ответа, удержание, NPS, доля эскалаций, доля ручных корректировок, точность фактов с проверкой.

Аналитика

Amplitude, Mixpanel, PostHog, Segment, dbt-модели.

Локализация и мультиязычность

Языки

Русский, немецкий, все остальные с переводом реалтайм.

Инструменты

Google Cloud Translate, Yandex Translate.

Наборы данных и сбор корпусов

Источники

Wikipedia, интернет.

Хостинг

Hugging Face Datasets, Kaggle, OpenML.

Юридические аспекты

Лицензии датасетов, авторские права, PII-фильтрация, TOS-согласование.

Среды разработки

IDE и ноутбуки

VS Code, PyCharm, Cursor, IntelliJ IDEA, Google Colab, Jupyter Notebook.

Профилировщики

PyTorch Profiler, TensorBoard, SQL Profiler.

Соответствие требованиям предприятия

Архивирование

WORM-хранилища, неизменяемые снапшоты, сквозное шифрование, ротация ключей.

Аудит

Централизованные логи, подпись событий, хранение артефактов, контроль доступа с MFA.

Резюме компетенций

Направления

Проектирование и внедрение LLM/RAG-сервисов, интеграция через API и шины данных, контроль качества и безопасности, снижение затрат, масштабирование до промышленных нагрузок.

Технологии

GPT-4.1, Claude 3.5, Gemini 1.5, Llama 3, LangChain, LlamaIndex, Spark, Kubernetes.

Popular repositories Loading

  1. serg-stone serg-stone Public

  2. flask_bot_telegram_webwidget flask_bot_telegram_webwidget Public

    Бот может произвести запись клиента к адвокату через бота в Телеграм или через виджет на сайте. Также бот с помощью ИИ может проконсультировать об услугах адвоката и ответить на вопросы клиента.

    Python

  3. 500-AI-Agents-Projects 500-AI-Agents-Projects Public

    Forked from ashishpatel26/500-AI-Agents-Projects

    The 500 AI Agents Projects is a curated collection of AI agent use cases across various industries. It showcases practical applications and provides links to open-source projects for implementation…

  4. agents-towards-production agents-towards-production Public

    Forked from NirDiamant/agents-towards-production

    This repository delivers end-to-end, code-first tutorials covering every layer of production-grade GenAI agents, guiding you from spark to scale with proven patterns and reusable blueprints for re…

    Jupyter Notebook

  5. nn-zero-to-hero nn-zero-to-hero Public

    Forked from karpathy/nn-zero-to-hero

    Neural Networks: Zero to Hero

    Jupyter Notebook

  6. machine-learning-visualized machine-learning-visualized Public

    Forked from gavinkhung/machine-learning-visualized

    ML algorithms implemented and derived from first-principles in Jupyter Notebooks and NumPy

    TeX