AMA Digital · Technical Blueprint v1

AI Agent ArchitectureАрхитектура AI-агентов

Author: Roman AbolmasovАвтор: Роман Аболмасов
May 2026 · Draft
Sources: meetings 01.05 & 12.05Источники: встречи 01.05 и 12.05
Summary:Резюме: AMA Digital builds a unified AI stack for two products — Weeden (cannabis retail, Thailand) and Humanist (mental wellness) — on a shared technology core. Core innovation: customer State Object triggers a coordinated agent chain — in-store, at home, and in the clinic. AMA Digital строит единый AI-стек для двух продуктов — Weeden (cannabis retail, Таиланд) и Humanist (mental wellness) — на общем технологическом ядре. Ключевая инновация: State Object клиента запускает скоординированную цепочку агентов — в магазине, дома, в клинике.
Key DecisionsКлючевые решения
AreaОбластьDecisionРешение
ProductsПродуктыWeeden Retail AI + Humanist 2.0 — one tech stack, two UX tracksWeeden Retail AI + Humanist 2.0 — один технологический стек, два UX-трека
ArchitectureАрхитектураSupervisor-Worker (orchestrator + subagents) — same pattern for retail and mental healthSupervisor-Worker (оркестратор + субагенты) — одинаковый паттерн для ритейла и mental health
LaunchЗапускMode 1 (HITL): human approves critical actions → move to Mode 2 after validationMode 1 (HITL): человек утверждает критичные действия → переход к Mode 2 после валидации
Voice / PhoneГолос / ТелефонVapi + Eleven Labs — customer talks to AI without installing the appVapi + Eleven Labs — клиент разговаривает с AI без установки приложения
Friday deadlineДедлайнDiagrams ready → next week: people, money, timeline estimatesДиаграммы готовы → следующая неделя: оценки людей, денег, сроков
Three Value AxesТри оси ценности
SleepСон
Sleep ≥6h45m · Deep ≥55mСон ≥6ч45м · Глубокий ≥55м
Humanist App + Weeden CBD/sleep bundleHumanist App + Weeden CBD/sleep bundle
StressСтресс
HRV ↑ 42ms → 60ms
Mental Health Agent + Retail consultMental Health Agent + Retail consult
Emotional HealthЭмоц. здоровье
Mood score + journaling frequencyMood score + частота журналирования
Conversation Agent + Outcome trackingConversation Agent + Outcome tracking
Canonical Entity ModelКаноническая модель сущностей
EntityСущностьResponsibilityОтветственностьKey DataКлючевые данныеInterfacesИнтерфейсы
Customer / StateКлиент / StateState, profile, history, consentСостояние, профиль, история, согласиеState Object, profile, historyAll channelsВсе каналы
Home / Device (SA)Дом / Устройство (SA)Mental health conversation, tracking, follow-upРазговор, трекинг, follow-upWearable data, journal, state logWearable, журнал, лог состоянийVoice, App, Push
Store Agent (Weeden)Агент магазинаIn-store detection, recommendation, checkoutДетекция в магазине, рекомендация, чекаутProduct catalog, transaction, tagsКаталог, транзакция, тегиTablet, POS, Camera
Clinical AgentКлинический агентTransfer clinical context to specialistПередача клинического контекста специалистуFHIR/OMOP, clinical notesEMR, Clinic UI
Enterprise CoreЯдро предприятияOrchestration, policies, routing, auditОркестрация, политики, маршрутизация, аудитEvent log, policy rules, KPIsEvent bus, APIs
Systems of RecordСистемы учётаCRM, POS/ERP, inventory, campaignsинвентарь, кампанииTransactional truth, campaignsТранзакционная правда, кампанииCRM, ERP, WMS
Comms LayerКоммуникацииVoice, SMS, Push, multilingual responseГолос, SMS, Push, многоязычный ответSession, language, channel prefСессия, язык, предпочтения каналаVapi/Twilio
Agent Catalog — 12 agents · Supervisor-Worker patternКаталог агентов — 12 агентов · паттерн Supervisor-Worker
AgentАгент RoleРоль Model / ToolМодель / Инструмент TierТир HITL MVP
OrchestratorОркестратор Planning, policy, routingПланирование, политика, маршрутизация Claude 3.5 Sonnet / GPT-4o A No (auto)Нет (авто)
State DetectionДетекция состояния State Object from signalsState Object из сигналов GPT-4o-mini + CV API B NoНет
Safety AgentАгент безопасности Crisis detection, PDPA, escalationКризис, PDPA, эскалация MindGuard + Tier A fallback A Yes — escalationДа — эскалация
Conversation AgentАгент разговора Dialogue: voice + text, Alter EgoДиалог: голос + текст, Alter Ego Llama 3 70B / GPT-4o-mini B NoНет
Recommendation AgentАгент рекомендаций State → product / interventionState → продукт / вмешательство RAG + Llama 3 70B B NoНет
Checkout AgentАгент заказа Checkout, POS sync, inventoryЧекаут, POS-синк, инвентарь Rule + GPT-4o-mini B Yes — confirmationДа — подтверждение
CRM AgentАгент CRM Tags, cohorts, profileТеги, когорты, профиль GPT-4o-mini C NoНет
Campaigns AgentАгент кампаний Trigger sequences, pushТриггерные рассылки, push Llama 3 8B C NoНет
Inventory AgentАгент инвентаря Replenishment, forecastПополнение склада, прогноз Rule-based + LLM C NoНет
Voice StackГолосовой стек Vapi: call without appVapi: звонок без приложения Eleven Labs + Vapi Voice NoНет
Audit AgentАгент аудита Immutable trace, compliance logImmutable trace, compliance log Always onВсегда активен
Alter Ego (v2) Digital copy of customer in store/homeЦифровая копия клиента в магазине/дома Tier A (future) A PartialЧастично Post-MVP
Architecture pattern (Mermaid)Паттерн архитектуры (Mermaid)
flowchart TD
  SIG[Customer Signals · voice · wearables · behaviorСигналы клиента · голос · wearables · поведение]
  SIA[State Detection · State ObjectДетекция состояния · State Object]
  ORC[ORCHESTRATOR · Claude 3.5 · Tier A]
  SAF[Safety · MindGuard]  CON[Conversation · Llama 3]  REC[Recommendation · RAG]
  CHK[Checkout · POS]  CRM[CRM · Tags]  CAM[Campaigns · Push]  INV[Inventory]
  AUD[Audit · always onвсегда]  VOI[Vapi · Eleven Labs]
  SIG --> SIA --> ORC
  ORC --> SAF & CON & REC & CHK & CRM & CAM & INV & AUD
  CON --> VOI
Product Flows → Agent ChainsПродуктовые флоу → Цепочки агентов
Retail: unknown customerРозница: неизвестный клиент
01
ChainЦепочка
State Detection → Conversation → Recommendation → CRM Tag
Fallback
Sales script for staffСкрипт для продавца
Retail: known / touristРозница: известный / турист
02
ChainЦепочка
Context Retrieval → Recommendation → Upsell → Inventory check
Fallback
Standard offerСтандартное предложение
Checkout confirmationПодтверждение покупки
03
ChainЦепочка
Checkout → POS sync → Inventory decrement → CRM update → Campaign trigger
Fallback
Manual checkout + deferred syncРучной чекаут + отложенный синк
Home: stress / anxiety (HRV 42ms)Дома: стресс / тревога (HRV 42ms)
04
ChainЦепочка
State Detection → Conversation → Recommendation → Safety gate
Fallback
Escalation to specialistЭскалация к специалисту
Home: sleep degradation (5h50m)Дома: нарушение сна (5ч50м)
05
ChainЦепочка
State Detection → Recommendation → Outcome tracking → Campaign
Fallback
Push + manual follow-upPush + ручной follow-up
Store: customer wants to relaxМагазин: клиент хочет расслабиться
06
ChainЦепочка
State Detection → Recommendation (CBD bundle) → Checkout
Fallback
Staff with scriptПродавец по скрипту
⚠ Crisis situation⚠ Критическая ситуация
07
ChainЦепочка
Safety Agent → Human escalation → Audit log
Fallback
Always humanВсегда человек
Voice Stack — Vapi + Eleven LabsГолосовой стек — Vapi + Eleven Labs
Key requirement (meeting 12.05):Ключевое требование (митинг 12.05): Customer calls or speaks in the store — without installing the app. Vapi solves the "telephone customer" problem. Клиент звонит или говорит в магазине — без установки приложения. Vapi решает задачу «телефонного клиента».
Vapi
Telephony: inbound/outbound calls via AI agentТелефония: входящие/исходящие звонки через AI-агента
Tool for agent — decides itself when to callTool для агента — решает сам когда позвонить
Eleven Labs
Voice synthesis — indistinguishable from humanСинтез голоса — неотличимо от человека
Customisable voice for Alter Ego / brandНастраиваемый голос под Alter Ego / бренд
MultilingualМногоязычность
EN / RU / TH / UK
Auto-response in customer language. Priority for Weeden — tourists from different countriesАвто-ответ на языке клиента. Приоритет для Weeden — туристы из разных стран
Token saving (Rust)
20–40% cost reduction on voice sessionsСнижение затрат 20–40% на голосовых сессиях
Apply as dependency in agent runtimeПрименять как зависимость в агентном runtime
Infrastructure — GCP baseline + Azure optionИнфраструктура — GCP baseline + Azure опция
API / Auth
Cloud Endpoints / APIM
API Gateway + JWT/OAuth
✓ MVP
Agent RuntimeАгентный runtime
Cloud Run / ACI / EKS
Orchestrator + Agent poolОркестратор + пул агентов
✓ MVP
Model Gateway
Vertex AI / Azure OpenAI / Bedrock
Tier A/B/C router
✓ MVP
Event Bus
Pub/Sub / Kafka / SQS
Async tasks between agentsAsync задачи между агентами
✓ MVP
Vector Store / RAG
Pinecone / Weaviate / AlloyDB
Embeddings
✓ MVP
Profile / State DB
Firestore / CosmosDB
Customer context storeКонтекстное хранилище клиента
✓ MVP
Observability
Cloud Trace / Datadog
Traces, metrics, alertsТрейсы, метрики, алерты
✓ MVP
Audit Ledger
BigQuery / Blob immutable
PDPA complianceСоответствие PDPA
✓ MVP
Edge / Offline
Gemma / Llama on-device
Gemma API
Post-MVP
BYOK
Customer brings own model keyКлиент приносит свой ключ модели
Provider abstraction
Post-MVP
Retail hardwareОборудование ритейла
DeviceУстройствоPurposeНазначениеStatus
Tablet (staffпродавец)Agent recommendation display for budtenderДисплей рекомендаций агента для бадтендераMVP
Camera (CV)Behavioural detection of unknown customerДетекция поведения неизвестного клиентаMVP opt.
POSOrder sync, inventory, CRMСинк заказа, инвентаря, CRMMVP
Display / screenДисплей / экранVisual AI persona / Alter Ego for customerВизуальный AI-персонаж / Alter Ego для клиентаPost-MVP
Edge deviceLocal model without internetЛокальная модель при отсутствии интернетаPost-MVP
Model Tier RoutingТировая маршрутизация моделей
TierТирAgentsАгентыModelsМодели~Cost / 1K tokens~Стоимость / 1KCost controlsКонтроль затрат
A — High Orchestrator, Safety, Clinical triageОркестратор, Безопасность, Клиническая триаж Claude 3.5 Sonnet / GPT-4o $0.015–0.060 Strict thresholds · gates before callСтрогие пороги · гейты перед вызовом
B — Medium Conversation, Recommendation, CheckoutРазговор, Рекомендации, Чекаут Llama 3 70B / GPT-4o-mini $0.001–0.008 Context pruning · session cacheПрунинг контекста · сессионный кэш
C — Low CRM tags, Campaigns, InventoryCRM-теги, Кампании, Инвентарь Llama 3 8B / GPT-4o-mini <$0.001 Batching · templates · cheap pipelineБатчинг · шаблоны · дешёвый pipeline
Voice Vapi + Eleven Labs Eleven Labs TTS + Vapi $0.05–0.12 / min Compression · token saving (Rust)Сжатие · token saving (Rust)
Traffic scenariosСценарии трафика
ScenarioСценарийTransactions / moТранзакций / месModel strategyСтратегия моделейMain cost driversОсновные драйверы
POC / Low~1 000Frontier-heavy (testing)Frontier-heavy (тестирование)Experimental Tier A callsЭкспериментальные вызовы Tier A
Launch / MVP~10 000Hybrid: Tier A rarely, B/C mainГибрид: Tier A редко, B/C основныеVapi voice sessionsГолосовые сессии Vapi
Scale~100 000+Small-model Tier C optimisationSmall-model оптимизация Tier CContext window bloatContext window bloat
Cost-saving techniquesКлючевые приёмы экономии
Token saving (Rust)
Apply as agent runtime dependency — 20–40% savings on voiceПрименять как зависимость — экономия 20–40% на голосе
Context pruning
Trim history > N messages, keep only summary + key factsОбрезать историю > N сообщений, хранить только summary + ключевые факты
Session distillation
After session: save distillate, not full logПосле сессии: сохранять дистиллят, не полный лог
Confidence-based escalation
Tier C → B → A only on low confidenceTier C → B → A только при низкой уверенности
Embedding cache
Frequent products / protocols — no recalculation each timeЧастые продукты / протоколы — не пересчитывать каждый раз
BYOK
Customer brings own model key — reduces COGS at scaleКлиент приносит свой ключ — снижает COGS при масштабе
Buy vs Build
ComponentКомпонентDecisionРешениеRationaleОбоснование
Model API (LLM)BUY OpenAI / Anthropic / GCPFaster, not our moat; abstraction allows provider swapБыстрее, не наш moat; абстракция позволяет менять провайдера
Voice stackГолосовой стекBUY Vapi / Eleven LabsAlready production-ready; integrate as agent toolУже production-ready; интеграция как tool для агента
OrchestrationBUY LangGraph / AutoGen / CrewAIDon't reinvent the wheel; tested patternsНе изобретать велосипед; протестированные паттерны
Vector Store / RAGBUY Pinecone / WeaviateCommodity; only prompt quality tuning mattersCommodity; критично только quality тюнинг промптов
CRM / ERP / POSBUY existing client systemsсуществующие системы клиентаIntegrate via adapters, don't replaceИнтегрировать через адаптеры, не заменять
Safety / GuardrailsBUY MindGuard / NeMoClinically tested; don't build yourselfКлинически протестированы; самостоятельно не строить
State DetectionBUILD our core IPнаш core IPUnique link state→agent→outcome — our moatУникальная связка state→agent→outcome — наш moat
Outcome trackingBUILD data flywheelstate→product→outcome data — long-term advantageДанные state→product→outcome — долгосрочное преимущество
Agent tool connectorsBUILD thin adaptersWeeden / Humanist specifics; easy but neededСпецифика Weeden / Humanist; несложно, но нужно
Alter Ego / SA profileBUILD Post-MVPUnique personalisation; start after Mode 1Уникальная персонализация; стартовать после Mode 1
Mode 1 vs Mode 2Два режима работы
ParameterПараметрMode 1: HITL — MVPMode 2: Self-Service — Post-MVP
Agent chain ends atЦепочка заканчивается на«Recommendation to staff»«Рекомендация продавцу»«Autonomous action»«Автономное действие»
Decision authorityАвторитет решенийHuman (staff / customer explicitly confirms)Человек (продавец / клиент явно подтверждает)AI agent under policy supervisionAI-агент под надзором политик
Operational riskОперационный рискLow — human filters errorsНизкий — человек фильтрует ошибкиHigh — need robust fail-safesВысокий — нужны надёжные fail-safes
Response speedСкорость ответаSlower (waiting for confirmation)Медленнее (ожидание подтверждения)Instant (machine speed)Мгновенно (скорость машины)
Launch goalЦель запускаValidation + staff productivityВалидация + продуктивность персоналаScale + COGS reductionМасштаб + снижение COGS
When to switchКогда переходитьNOW (MVP)СЕЙЧАС (MVP)After 3–6 months of Mode 1 dataПосле 3–6 мес. данных Mode 1
Recommendation:Рекомендация: Launch Mode 1. Collect data on successful agent decisions. Move specific scenarios to Mode 2 only after AI consistently meets or exceeds human decision quality. Запустить Mode 1. Собрать данные об успешных агентных решениях. Переводить конкретные сценарии в Mode 2 только после того, как AI стабильно превышает или соответствует качеству человеческих решений.
MVP Scope — What we build nowСкоп MVP — Что строим сейчас
MVP — NowMVP — Сейчас
CEM (6 entities)CEM (6 сущностей)
Orchestrator + 8 core subagentsОркестратор + 8 ключевых субагентов
Retail assisted flow (unknown / known / checkout)Retail assisted flow (unknown / known / checkout)
Home: stress + sleep flowsДома: стресс + сон
Vapi voice stackголосовой стек
CRM / POS / Inventory connectorsБазовые коннекторы CRM/POS/Inventory
Static model tier routingСтатическая тировая маршрутизация
Audit logs + Safety Agent
Post-MVPPost-MVP
Alter Ego automationАвтоматизация Alter Ego
Dynamic routing 15+ modelsДинамическая маршрутизация 15+ моделей
Adaptive multi-agent networkАдаптивная мультиагентная сеть
Clinical Agent (FHIR)
Edge / offline modelsEdge / offline модели
BYOK
Not nowНе сейчас
Self-improving RL loopsSelf-improving RL loops
High-risk clinical automation without validationВысокорисковая клиническая автоматизация без валидации
Fully autonomous Mode 2 without Mode 1 dataПолностью автономный Mode 2 без данных Mode 1
Open Questions & AssumptionsОткрытые вопросы и допущения
AssumptionДопущение
Azure — main cloud provider (HIPAA-compliance)Azure — основной облачный провайдер (HIPAA-compliance)
Owner:Кто отвечает: Roman + Artem
AssumptionДопущение
Mode 1 gives 20–30% staff efficiency gain — needs validationMode 1 даёт 20–30% рост эффективности персонала — нужна валидация
Owner:Кто отвечает: Team
QuestionВопрос
Will ERP/CRM handle latency < 2s for voice sessions?Выдержат ли ERP/CRM latency < 2 сек для голосовых сессий?
Owner:Кто отвечает: Roman + Andrei
QuestionВопрос
MVP KPI hierarchy: conversion / retention / revenue / frequency?KPI иерархия MVP: конверсия / удержание / доход / частота?
Owner:Кто отвечает: Artem + Tonya
QuestionВопрос
Duty-to-protect thresholds for mental health in Thailand and Ukraine?Пороги duty-to-protect по mental health в Таиланде и Украине?
Owner:Кто отвечает: Artem + specialists
QuestionВопрос
Mode 1 operating model: who approves which actions?Операционная модель Mode 1: кто и какие действия утверждает?
Owner:Кто отвечает: Tonya + Danil
QuestionВопрос
Alter Ego — internal build or partnership with Mironov?Alter Ego — внутренний build или партнёрство с Мироновым?
Owner:Кто отвечает: Artem
Friday Review — Talking Points (5–7 min)Пятничный ревью — Talking Points (5–7 минут)
1
ARCHITECTURE
One pattern — Supervisor-Worker — works for both retail and mental health. Same agents, different configuration.Один паттерн — Supervisor-Worker — работает для ритейла и mental health. Те же агенты, разная конфигурация.
2
STATE-TRIGGERED
Customer names a state (stress, sleep, relaxation) → system launches a chain. This is our differentiator, not just a chatbot.Клиент называет состояние (стресс, сон, расслабление) → система запускает цепочку. Это наш differentiator, не просто чат-бот.
3
VAPI / VOICE
Customer in-store or on the phone — without installing the app. Vapi + Eleven Labs solves it now.Клиент в магазине или по телефону — без установки приложения. Vapi + Eleven Labs решает задачу сейчас.
4
MODE 1 FIRST
Launch with HITL. Human approves critical actions. Move to autonomy only after data.Запускаем с HITL. Человек утверждает критичные действия. Переходим к автономии только после данных.
5
COST
Three model tiers: A (expensive, rare), B (medium, dialogue), C (cheap, automation). Vapi — main voice cost driver.Три тира моделей: A (дорогой, редко), B (средний, диалог), C (дешёвый, автоматика). Vapi — основной голосовой драйвер затрат.
6
MVP SCOPE
8 agents + 2 flows (retail + home). Alter Ego and clinical — after MVP. Team and timeline estimation can start.8 агентов + 2 флоу (retail + home). Alter Ego и clinical — после MVP. Можно начать оценку команды и сроков.