21 мар. 2025 г.·7 мин

Стратегия логирования для генерируемых бэкендов: что логировать и правила маскировки PII

Q: What fields should every log entry include no matter what?

Хороший набор по умолчанию: `event`, `severity` и `request_id`, плюс базовый контекст исполнения — `service`, `environment`, `route`, `status` и `duration_ms`. Без `event` и `request_id` вы не сможете надежно группировать похожие проблемы или проследить одно действие пользователя сквозь систему.

Q: What’s the difference between security logs and audit logs?

`Security`‑логи нужны для обнаружения подозрительного поведения сейчас (повторные неудачные входы, попытки использования токенов). `Audit`‑логи нужны для последующего доказательства произошедшего — кто что и когда сделал для критичных действий (смена ролей, возвраты, переопределения доступа).

Освойте стратегию логирования для генерируемых бэкендов: что логировать для auth, платежей, воркфлоу и интеграций, а также понятные правила маскировки PII.

Почему логирование должно быть продуманным (а не просто громоздким)

Логи полезны только тогда, когда быстро отвечают на реальные вопросы: что сломалось, кто пострадал и можно ли доказать, что произошло. Надёжная стратегия логирования одновременно балансирует три потребности: быструю диагностику, надёжный аудиторский след для критичных действий и защиту данных пользователей.

Без плана команды обычно сталкиваются с одной из двух проблем. Либо недостаточно деталей для отладки продакшн‑сбоев, либо слишком много деталей и утечки чувствительной информации. Вторую проблему трудно исправить, потому что логи копируются в дашборды, бэкапы и сторонние инструменты.

Между полезностью и риском всегда есть натяжение. Нужен достаточный контекст, чтобы проследить запрос через сервисы и воркфлоу, но также нужны чёткие границы для секретов и персональных данных. «Логируйте всё» — не стратегия, а риск.

Разные люди читают логи по разным причинам, и это должно формировать то, что вы пишете. Разработчики ищут трассировки стека, неверные входы и тайминги. Саппорт нуждается в безопасных для пользователя подсказках, позволяющих воспроизвести проблему. Команда безопасности отслеживает шаблоны типа повторных неудачных входов. Команды соответствия и аудиторы интересуются, кто что сделал и когда.

Задайте ожидания для нетехнических команд: логи — не база данных и не место для «хранить детали про всякий случай». Если нужны пользовательские видимые записи, храните их в таблицах с контролем доступа, правилами хранения и согласием. Логи — это кратковременные операционные доказательства.

Если вы собираете систему на платформе вроде AppMaster, рассматривайте логирование как часть продукта бэкенда, а не как доделку. Решите заранее, какие события должны быть трассируемы (auth, платежи, шаги воркфлоу, интеграции), какие поля всегда безопасны, а какие должны быть замаскированы. Это сохраняет консистентность логов по мере регенерации приложения и его роста.

Типы логов и уровни простыми словами

Практическая стратегия начинается с общих имён для типов сообщений, которые вы записываете. Когда все используют одинаковые уровни и имена событий, поиск становится быстрее, оповещения — надёжнее, и вы избегаете шумных логов, которые скрывают настоящие проблемы.

Уровни, которые реально пригодятся

Уровни логов отражают срочность, а не «сколько текста». Небольшой набор покрывает большинство случаев:

Debug: детали для разработчиков (обычно выключен в продакшене).
Info: нормальные, ожидаемые события (пользователь обновил профиль, задача завершилась).
Warn: что‑то неожиданное, но система продолжает работать (повторная попытка, медленный запрос).
Error: действие провалилось и требует внимания (создание платежа не удалось, ошибка БД).
Security: подозрительные или чувствительные ситуации (паттерны злоупотреблений токенами, повторные неудачи входа).
Audit: «кто что сделал и когда» для соответствия и расследований.

Security и audit часто путают. Security‑логи помогают обнаруживать угрозы. Audit‑логи помогают восстановить и доказать, что произошло позже.

Структурированные логи: согласованные поля лучше простого текста

Простой текст в логах трудно фильтровать и легко испортить. Структурированные логи сохраняют одинаковые поля каждый раз (часто в JSON), поэтому поиск и дашборды остаются надёжными. Это особенно важно при генерируемом коде — согласованность одно из главных преимуществ, которое нужно сохранить.

Старайтесь логировать событие как набор полей (например, event_name, request_id, user_id, status) вместо абзаца текста.

Событие vs трассировка vs метрика

Термины пересекаются, но решают разные задачи:

Событие (лог): отдельное произошедшее действие (успешный вход, получен webhook).
Трассировка: путь запроса через сервисы.
Метрика: число во времени (уровень ошибок, длина очереди, задержка платежей).

Правила времени: выберите один формат и придерживайтесь его

Используйте ISO 8601 и логируйте всё в UTC. Если нужен часовой пояс пользователя для отображения — храните его отдельно. Это предотвращает путаницу с зонами при инцидентах.

Практическая таксономия: общие поля, которые должны быть в каждом логе

Ключевое решение простое: каждое важное событие должно быть читаемым человеком и фильтруемым машиной. Это означает короткие сообщения и согласованные поля.

Основные поля (используйте везде)

Если каждая запись лога имеет одинаковый «каркас», вы сможете проследить один запрос через сервисы и деплои, даже если бэкенд регенерируется.

timestamp и severity (info/warn/error)
event (стабильное имя, например auth.login.succeeded)
service, environment и build (версия или коммит)
request_id (уникален для входящего запроса)
route, status и duration_ms

Считайте severity, event и request_id обязательными. Без них вы не сможете надежно искать, группировать или коррелировать логи.

Поля контекста (добавляйте только по релевантности)

Контекст делает логи полезными, не превращая их в дамп данных. Добавляйте поля, которые объясняют, что система пыталась сделать.

user_id (внутренний ID, не email и не телефон)
tenant_id или org_id (для multi‑tenant приложений)
workflow (имя процесса или шаг)
integration (имя провайдера/системы)
feature_flag (ключ флага при изменении поведения)

В AppMaster, где логика идет через Business Process, логирование workflow и step показывает, где запрос застопорился, сохраняя при этом краткость сообщений.

Держите текст сообщения в одной строке (что произошло), подробности кладите в поля (почему произошло). Пример структурированной записи:

{
  "severity": "info",
  "event": "payment.intent.created",
  "service": "backend",
  "environment": "prod",
  "build": "2026.01.25-1420",
  "request_id": "req_8f3a...",
  "route": "POST /checkout",
  "status": 200,
  "duration_ms": 184,
  "user_id": 48291,
  "tenant_id": 110,
  "integration": "stripe"
}

С таким подходом вы можете регенерировать код, менять инфраструктуру и добавлять новые воркфлоу, сохраняя сопоставимость логов во времени.

Логирование аутентификации: что фиксировать, не раскрывая креденшелы

Auth‑логи показывают попытки угона аккаунтов и помогают ответить на «я не смог войти». Но именно здесь часто случайно сливают секреты. Цель — высокая трассируемость без чувствительных значений.

Рассматривайте auth как два потока с разными требованиями:

Audit‑логи отвечают "кто что сделал и когда".
Debug/ops‑логи объясняют "почему это не сработало".

Что логировать при аутентификации и сессиях

Фиксируйте ключевые события как структурированные записи с устойчивыми именами и корреляционным request ID, чтобы проследить один вход через системы.

Логируйте попытки входа (успех/неудача) с кодом причины, например bad_password, unknown_user, mfa_required, account_locked. Отслеживайте жизненный цикл MFA (вызов, способ, успех/неудача, fallback). Отмечайте события сброса пароля (запрошен, токен отправлен, токен подтверждён, пароль изменён). Логируйте жизненный цикл сессий и токенов (создан, обновлён, отозван, истёк). Также фиксируйте действия администраторов над учетными записями: смена ролей, отключение/включение аккаунтов.

Если вы используете генерируемый бэкенд AppMaster и модуль аутентификации, фокусируйтесь на бизнес‑исходе (разрешено или отказано), а не на деталях реализации — так логи остаются стабильными при регенерации.

Решения авторизации (контроль доступа)

Каждое важное allow/deny должно быть объяснимо. Логируйте тип ресурса и действие, роль пользователя и короткий код причины. Избегайте логирования полных объектов или результатов запросов.

Пример: агент поддержки пытается открыть админский экран. Логируйте decision=deny, role=support, resource=admin_panel, reason=insufficient_role.

Маскировка секретов и фиксирование сигналов безопасности

Никогда не логируйте пароли, одноразовые коды, recovery‑коды, сырые access/refresh токены, session_id, API‑ключи, Authorization заголовки, cookies, полные JWT или полные тексты SMS/email проверок.

Вместо этого логируйте безопасные сигналы: хешированные или усечённые идентификаторы (например, последние 4 символа хеша токена), IP и user agent (с маскированием по необходимости), и счётчики аномалий (много неудач, необычные геоперемещения, повторное использование токенов). Эти сигналы помогают обнаруживать атаки, не выдавая атакующему нужную информацию.

Логирование платежей: доказуемость для Stripe и аналогов

Построить бэкенд с безопасными логами

Создайте генерируемый Go‑бэкенд со структурированными событиями и маскировкой с самого начала.

Попробовать AppMaster

Логи по платежам должны быстро отвечать на вопрос: что произошло с этим платежом и можно ли это доказать. Делайте ставку на трассируемость, а не на дамп полезной нагрузки.

Логируйте жизненный цикл платежа как серию маленьких, согласованных событий. Не нужно записывать всё подряд, достаточно ключевых моментов: intent создан, подтверждён, неудача, возврат и любые споры или chargeback.

Для каждого события храните компактные ссылки, которые позволяют сопоставить логи с дашбордом провайдера и тикетами поддержки:

provider (например, Stripe)
provider_object_id (payment_intent, charge, refund, dispute ID)
amount и currency
status (created, confirmed, failed, refunded, disputed)
error_code и короткое нормализованное error_message

Держите чувствительные данные вне логов, даже в debug‑режиме. Никогда не логируйте полные числа карт, CVC или полные адреса биллинга. Для корреляции с клиентом логируйте внутренний customer_id и order_id, а не полное имя, email или адрес.

Webhook‑и: логируйте конверт, а не тело

Webhooks шумные и часто содержат больше персональных данных, чем ожидалось. По умолчанию логируйте только event_id, event_type и результат обработки (accepted, rejected, retried). Если вы отвергаете webhook, логируйте понятную причину (signature check failed, unknown object, duplicate event). Полный полезный груз храните только в безопасном месте с контролем доступа, если он действительно нужен.

Споры и возвраты требуют аудита

Возвраты и ответы на споры — операции высокого риска. Записывайте, кто запустил действие (user_id или service_account), когда это произошло и что было запрошено (сумма возврата, код причины). В AppMaster это часто означает добавление явного шага лога в Business Process, вызывающий Stripe.

Пример: агент поддержки делает возврат $49. В логах должны быть order_id, refund ID от Stripe, user_id агента, временная метка и итоговый статус, без раскрытия данных карты или адреса.

Логирование воркфлоу: делайте бизнес‑процессы наблюдаемыми

Воркфлоу — это где происходит бизнес: заказ подтверждён, тикет маршрутизирован, возврат запрошен, клиент уведомлён. Если бэкенд генерируется из визуального процесса (как Business Process Editor в AppMaster), логирование должно следовать воркфлоу, а не только коду. Иначе вы получите ошибки без истории.

Рассматривайте запуск воркфлоу как последовательность событий. Просто: шаг начат, завершён, упал или перезапущен. По такой модели вы сможете восстановить ход событий, даже если одновременно идёт много запусков.

Для каждого события воркфлоу включайте небольшой согласованный набор полей:

имя и версия workflow (или временная метка последнего редактирования)
run_id (уникальный ID выполнения)
имя шага, тип шага, номер попытки
тип события (started, completed, failed, retried) и статус
тайминги (длительность шага и суммарное время выполнения)

Входы и выходы — место, где команды часто ошибаются. Логируйте форму данных, а не сами данные. Предпочитайте имена схем, списки присутствующих полей или устойчивые хеши. Если нужно больше деталей для отладки, фиксируйте счёты и диапазоны (например, items=3 или total_cents=1299), а не имена, email‑ы, адреса или свободный текст.

Действия операторов должны быть отдельными событиями: если админ одобрил запрос, отменил запуск или переопределил шаг, логируйте кто это сделал (user_id, роль), что сделал (action), почему (reason_code) и состояние до/после.

Пример: воркфлоу «Утверждение расходов» падает на шаге «Уведомить менеджера» из‑за сбоя мессенджера. Хорошие логи покажут run_id, падение шага, попытки повторов и время ожидания, чтобы ответить — было ли уведомление отправлено позже, кто это одобрил и какие запуски зависли.

Логирование интеграций: API, очереди и сторонние сервисы

Задайте правила маскировки один раз

Централизуйте allowlist и чувствительные ключи, чтобы генерируемый код оставался безопасным.

Попробуйте

Именно в интеграциях бэкенды часто тихо падают. Пользователь видит «что‑то пошло не так», а причина — лимит скорости, истёкший токен или медленный провайдер. Логи должны делать каждый внешний вызов простым для трассировки, не превращая их в копию данных третьих сторон.

Логируйте каждый интеграционный вызов как событие с согласованной формой. Фокусируйтесь на «что произошло» и «сколько времени заняло», а не на дампе payload.

Что логировать для каждого внешнего вызова

Зафиксируйте достаточно, чтобы отлаживать, измерять и аудировать:

имя провайдера (например, Stripe, Telegram, email/SMS, AWS, OpenAI)
endpoint или имя операции (ваше внутреннее имя, а не полный URL)
метод/действие, статус/результат, latency в ms, число попыток
корреляционные идентификаторы (ваш request_id плюс ID со стороны провайдера, если он есть)
события circuit breaker и backoff (opened, half-open, closed, retry_scheduled)

Корреляционные ID важны, когда воркфлоу задевает несколько систем. Если одно действие пользователя вызывает и email, и проверку платежа, один и тот же request_id должен появиться во всех связанных логах, плюс message ID провайдера или payment ID, если он доступен.

Когда вызов падает, классифицируйте ошибку единообразно по провайдерам. Тогда дашборды и оповещения будут полезнее, чем сырые тексты ошибок.

auth error (expired token, invalid signature)
rate limit (HTTP 429 или код провайдера)
validation error (bad parameters, schema mismatch)
timeout/network (connect timeout, DNS, TLS)
provider fault (5xx, service unavailable)

По умолчанию избегайте логирования сырых тел запросов/ответов. Если нужно взять сэмпл для отладки, защитите это флагом с коротким сроком и сначала санитизуйте (удалите токены, секреты, email‑ы, телефоны, полные адреса). В AppMaster, где интеграции часто конфигурируются визуально, сохраняйте поля логов согласованными даже при изменениях потока.

Правила маскировки PII, которыми могут пользоваться разработчики

Отправляйте платежные потоки с доказательствами

Постройте логи платежей Stripe с провайдерскими ID и статусами, доступными для поиска.

Собрать платежи

Маскировка лучше всего работает, когда она скучная и автоматическая. Логи должны помогать отлаживать и аудитить, не позволяя восстановить личность или похитить доступ, если логи утекли.

Сгруппируйте чувствительные данные в несколько корзин, чтобы все использовали одни и те же термины:

идентификаторы: полное имя, национальные номера, customer ID, привязанные к человеку
контакт: email, телефон, почтовый адрес
финансовое: номера карт, банковские реквизиты, payout information
локация и здоровье: точное местоположение, медицинские данные
креденшелы: пароли, API‑ключи, session cookies, OAuth коды, refresh токены

Затем выберите одно действие для каждой корзины и придерживайтесь его:

удалить полностью: креденшелы, секреты, сырые токены, полные номера карт
маскировать: email и телефоны (оставлять небольшую часть для саппорта)
усекать: длинные свободные тексты (замечания поддержки могут скрывать PII)
хешировать: устойчивые идентификаторы, когда нужно группирование, а не значение (используйте ключевой хеш, не plain SHA)
токенизировать: заменить внутренней ссылкой (например, user_id), а реальное значение хранить в другом месте

Безопасные примеры (что хранить в логах):

email: j***@example.com (маскируйте локальную часть, оставляйте домен)
телефон: ***-***-0199 (оставляйте 2–4 последних цифры)
адрес: удаляйте полный адрес; логируйте только country или region, если нужно
токены: удалять полностью; логировать только token_present:true или тип токена

Маскировка должна работать внутри вложенных объектов и массивов, а не только на верхнем уровне. Платёжный payload может содержать customer.email и charges[].billing_details.address. Если ваш логгер проверяет только первый уровень, он пропустит утечки.

Используйте подход allowlist‑first. Определите небольшой набор полей, которые всегда безопасны для логирования (request_id, user_id, event, status, duration_ms) и denylist известных чувствительных ключей (password, authorization, cookie, token, secret, card_number). В инструментах вроде AppMaster вынесите эти правила в общую middleware, чтобы поведение наследовалось каждым эндпойнтом и воркфлоу.

Как поэтапно внедрять стратегию

Запишите схему логов до того, как начнёте править код. Если бэкенд генерируется (например, Go‑сервис из AppMaster), нужна стратегия, которая переживёт регенерацию: согласованные имена событий, поля и одно место, где применяется маскировка.

Простой план развёртывания

Применяйте одни и те же правила везде: обработчики API, фоновые задачи, webhooks, расписанные воркфлоу.

Определите переиспользуемые имена событий, например auth.login_succeeded, payment.webhook_received, workflow.step_failed, integration.request_sent. Для каждого решите, какие поля обязательны.
Добавьте поля корреляции рано и сделайте их обязательными: request_id, trace_id (если есть), user_id (или anonymous) и tenant_id для multi‑tenant приложений. Генерируйте request_id на краю (edge) и передавайте во все внутренние вызовы.
Ставьте маскировку на границе логирования, до записи. Используйте middleware или обёртку логгера, которая удаляет или маскирует чувствительные ключи из тел запросов и ответов.
Установите уровни логов по окружению. В продакшене отдавайте приоритет info для ключевых событий и warn/error для сбоев. Избегайте verbose debug‑дампов. В девелопменте можно больше деталей, но маскировка должна оставаться включённой.
Докажите работоспособность тестовыми реалистичными payload: включите PII намеренно (email, телефоны, токены) и проверьте, что в сохранённых логах остаются только безопасные значения.

После деплоя проводите учения по инцидентам раз в месяц. Выберите сценарий (невоспроизведённый webhook Stripe, всплеск неудачных входов, зависший воркфлоу) и проверьте, отвечают ли логи на вопросы: что случилось, кому, когда и где, без раскрытия секретов.

Сделайте схему самокорректирующейся

Сделайте так, чтобы отсутствующие обязательные поля было трудно игнорировать. Полезная практика — откатывать сборку, если отсутствуют обязательные поля, и выборочно проверять прод‑логи на:

отсутствие сырых паролей, токенов и полных карт
у каждого запроса есть request_id и (по необходимости) tenant_id
ошибки включают безопасный error_code и контекст, а не дамп payload

Распространённые ошибки, создающие риск или слепые зоны

Спроектируйте ваши аудиторские события

Проектируйте аудиторские следы для аутентификации, платежей и действий администратора как часть рабочего процесса.

Начать проект

Логи становятся бесполезными (или опасными), когда превращаются в хранилище всего подряд. Цель — ясность: что произошло, почему и кто/что это инициировал.

1) Непреднамеренная утечка секретов

Большинство утечек случайны. Частые источники: заголовки запроса, auth‑токены, cookies, подписи webhook, «полезная» отладка с дампом full payload. Одна строка лога с Authorization или секретом webhook может превратить хранилище логов в хранилище ключей.

Если платформа генерирует код, задайте правила маскировки на краях (ingress, webhook‑хендлеры, интеграционные клиенты), чтобы все сервисы унаследовали безопасные настройки.

2) Свободный текст, который нельзя искать

Логи вроде «User failed to login» читаемы, но их трудно анализировать. Свободный текст не даёт возможности фильтровать по типу события, сравнивать причины ошибок или строить оповещения.

Предпочитайте структурированные поля (event, actor_id, request_id, outcome, reason_code). Человеческое предложение можно оставить как дополнительный контекст, а не как единственный источник правды.

3) Перегрузка payload и недокументированные решения

Команды часто записывают целые request/response, но забывают логировать важное решение. Примеры: «платёж отклонён» без статуса провайдера, «доступ запрещён» без правила политики, «воркфлоу упал» без шага и кода причины.

При сбое обычно важнее след решений, чем сырые payload.

4) Смешение audit и debug

Audit‑логи должны быть стабильными и удобны для обзора. Debug‑логи — шумные и меняются часто. Если смешать их, проверки соответствия становятся трудными, а важные события теряются.

Чётко разделяйте: audit — кто что сделал и когда; debug — как система туда попала.

5) Отсутствие политики хранения

Хранение логов навсегда увеличивает риск и стоимость. Удаление слишком быстро ломает расследования и ответы по chargeback.

Установите разные сроки хранения по типу логов (audit vs debug) и убедитесь, что экспорты, бэкапы и сторонние слои следуют той же политике.

Короткий чеклист и следующие шаги

Если логи работают, вы должны быстро ответить на один вопрос: «Что случилось с этим запросом?» Проверьте пункты ниже, чтобы выявить пробелы до ночных инцидентов.

Быстрый чеклист

Проведите проверку на реальном прод‑запросе (или в staging, который ему соответствует):

End‑to‑end трасса: можно ли проследить одно действие пользователя через сервисы по request_id и увидеть ключевые переходы?
Безопасность аутентификации: избегают ли auth‑логи на 100% паролей, session cookie, JWT, API‑ключей, magic links и reset tokenов?
Трассируемость платежей: содержат ли логи provider идентификаторы и статус‑изменения, при этом не хранятся данные карт или полные биллинговые данные?
Видимость воркфлоу: можно ли искать бизнес‑процессы по run_id и step_name с чётким стартом/успехом/падением и длительностями?
Ясность интеграций: логируют ли внешние вызовы провайдера, имя операции, latency, статус и безопасный короткий текст ошибки без дампа payload?

Если любой пункт «в основном» — считайте это «нет». Это работает только при последовательных и автоматических правилах.

Следующие шаги

Превратите чеклист в правила, которые команда сможет принудительно соблюдать. Начните с малого: одна общая схема, одно правило маскировки и несколько тестов, которые падают, если чувствительные поля проскальзывают.

Запишите схему логирования (общие поля и нейминг) и список маскировки (что маскировать, хешировать или удалять). Добавьте правила ревью кода, отклоняющие логи, содержащие сырые request bodies, заголовки или неотфильтрованные объекты пользователей. Создайте набор «безопасных событий» для auth, платежей, воркфлоу и интеграций, чтобы люди копировали согласованные шаблоны. Введите автоматические проверки (юнит‑тесты или lint), которые обнаруживают запрещённые поля вроде password, token и authorization. Пересматривайте квартально, чтобы убедиться, что выборка, уровни логов и сроки хранения соответствуют рискам и требованиям соответствия.

Если вы строите на AppMaster, имеет смысл централизовать эти правила и переиспользовать их по генерируемым Go‑бэкендам, воркфлоу и интеграциям. Хранение схемы и логики маскировки в одном месте упрощает поддержку при изменениях и регенерации на appmaster.io.

Вопросы и ответы

Начните с записи вопросов, на которые логи должны отвечать при инциденте: что сломалось, кто пострадал и где это произошло. Затем определите небольшую схему, которую вы будете использовать везде (например, event, severity, request_id, service, environment), чтобы команды могли последовательно искать и коррелировать события.

Хороший набор по умолчанию: event, severity и request_id, плюс базовый контекст исполнения — service, environment, route, status и duration_ms. Без event и request_id вы не сможете надежно группировать похожие проблемы или проследить одно действие пользователя сквозь систему.

Security‑логи нужны для обнаружения подозрительного поведения сейчас (повторные неудачные входы, попытки использования токенов). Audit‑логи нужны для последующего доказательства произошедшего — кто что и когда сделал для критичных действий (смена ролей, возвраты, переопределения доступа).

Никогда не логируйте сырые пароли, одноразовые коды, access/refresh токены, заголовки Authorization, cookies, API‑ключи или полные JWT. Вместо этого фиксируйте безопасные исходы и коды причин, а также внутренние идентификаторы вроде user_id и request_id, чтобы отлаживать без превращения логов в хранилище учётных данных.

Логируйте жизненный цикл платежа как ряд небольших, структурированных событий с ссылками на провайдера и внутренние ID: суммы, валюту, смены статусов и нормализованные коды ошибок обычно достаточно, чтобы сопоставить инцидент без хранения чувствительных платёжных данных.

Логируйте конверт webhooks и результат обработки, а не полный body. Фиксируйте event_id провайдера, event_type, приняли вы его или отвергли, и понятную причину отклонения — так можно безопасно воспроизводить событие без копирования персональных данных в логи.

Ведите каждое выполнение воркфлоу как последовательность событий: старт шага, завершение, ошибка, повтор. Логируйте run_id, имя шага и тайминги. Избегайте записи полных входов/выходов — логируйте формы данных, количества и безопасные сводки, чтобы процесс был наблюдаемым без утечки пользовательского контента.

Лог каждой внешней вызова должен включать имя провайдера, внутреннее имя операции, задержку, статус, число повторов и корреляционные идентификаторы вроде request_id. При ошибке классифицируйте её как auth, rate limit, validation, timeout или provider fault — так дашборды и оповещения будут единообразны между сервисами.

Подход allowlist-first: логируйте только поля, которые явно помечены как безопасные, и редактируйте всё остальное на границе логирования. Для PII — маскируйте или токенизируйте; для учётных данных и секретов — полностью удаляйте, чтобы они не утекли через дашборды, бэкапы или экспорт логов.

Вынесите схему логирования и правила маскировки в одно общее место, которое выполняется для каждого эндпойнта и воркфлоу, чтобы регенерация кода не создавала рассогласование. В AppMaster логируйте стабильные бизнес‑исходы и имена событий, а не детали реализации, чтобы логи оставались сопоставимыми между сборками.