AMA Digital — AI Blueprint

Summary:Резюме: AMA Digital builds a unified AI stack for two products — Weeden (cannabis retail, Thailand) and Humanist (mental wellness) — on a shared technology core. Core innovation: customer State Object triggers a coordinated agent chain — in-store, at home, and in the clinic. AMA Digital строит единый AI-стек для двух продуктов — Weeden (cannabis retail, Таиланд) и Humanist (mental wellness) — на общем технологическом ядре. Ключевая инновация: State Object клиента запускает скоординированную цепочку агентов — в магазине, дома, в клинике.

Key DecisionsКлючевые решения

AreaОбласть	DecisionРешение
ProductsПродукты	Weeden Retail AI + Humanist 2.0 — one tech stack, two UX tracksWeeden Retail AI + Humanist 2.0 — один технологический стек, два UX-трека
ArchitectureАрхитектура	Supervisor-Worker (orchestrator + subagents) — same pattern for retail and mental healthSupervisor-Worker (оркестратор + субагенты) — одинаковый паттерн для ритейла и mental health
LaunchЗапуск	Mode 1 (HITL): human approves critical actions → move to Mode 2 after validationMode 1 (HITL): человек утверждает критичные действия → переход к Mode 2 после валидации
Voice / PhoneГолос / Телефон	Vapi + Eleven Labs — customer talks to AI without installing the appVapi + Eleven Labs — клиент разговаривает с AI без установки приложения
Friday deadlineДедлайн	Diagrams ready → next week: people, money, timeline estimatesДиаграммы готовы → следующая неделя: оценки людей, денег, сроков

Three Value AxesТри оси ценности

SleepСон

Sleep ≥6h45m · Deep ≥55mСон ≥6ч45м · Глубокий ≥55м

Humanist App + Weeden CBD/sleep bundleHumanist App + Weeden CBD/sleep bundle

StressСтресс

HRV ↑ 42ms → 60ms

Mental Health Agent + Retail consultMental Health Agent + Retail consult

Emotional HealthЭмоц. здоровье

Mood score + journaling frequencyMood score + частота журналирования

Conversation Agent + Outcome trackingConversation Agent + Outcome tracking

Canonical Entity ModelКаноническая модель сущностей

EntityСущность	ResponsibilityОтветственность	Key DataКлючевые данные	InterfacesИнтерфейсы
Customer / StateКлиент / State	State, profile, history, consentСостояние, профиль, история, согласие	State Object, profile, history	All channelsВсе каналы
Home / Device (SA)Дом / Устройство (SA)	Mental health conversation, tracking, follow-upРазговор, трекинг, follow-up	Wearable data, journal, state logWearable, журнал, лог состояний	Voice, App, Push
Store Agent (Weeden)Агент магазина	In-store detection, recommendation, checkoutДетекция в магазине, рекомендация, чекаут	Product catalog, transaction, tagsКаталог, транзакция, теги	Tablet, POS, Camera
Clinical AgentКлинический агент	Transfer clinical context to specialistПередача клинического контекста специалисту	FHIR/OMOP, clinical notes	EMR, Clinic UI
Enterprise CoreЯдро предприятия	Orchestration, policies, routing, auditОркестрация, политики, маршрутизация, аудит	Event log, policy rules, KPIs	Event bus, APIs
Systems of RecordСистемы учёта	CRM, POS/ERP, inventory, campaignsинвентарь, кампании	Transactional truth, campaignsТранзакционная правда, кампании	CRM, ERP, WMS
Comms LayerКоммуникации	Voice, SMS, Push, multilingual responseГолос, SMS, Push, многоязычный ответ	Session, language, channel prefСессия, язык, предпочтения канала	Vapi/Twilio

Agent Catalog — 12 agents · Supervisor-Worker patternКаталог агентов — 12 агентов · паттерн Supervisor-Worker

AgentАгент	RoleРоль	Model / ToolМодель / Инструмент	TierТир	HITL	MVP
OrchestratorОркестратор	Planning, policy, routingПланирование, политика, маршрутизация	Claude 3.5 Sonnet / GPT-4o	A	No (auto)Нет (авто)	✓
State DetectionДетекция состояния	State Object from signalsState Object из сигналов	GPT-4o-mini + CV API	B	NoНет	✓
Safety AgentАгент безопасности	Crisis detection, PDPA, escalationКризис, PDPA, эскалация	MindGuard + Tier A fallback	A	Yes — escalationДа — эскалация	✓
Conversation AgentАгент разговора	Dialogue: voice + text, Alter EgoДиалог: голос + текст, Alter Ego	Llama 3 70B / GPT-4o-mini	B	NoНет	✓
Recommendation AgentАгент рекомендаций	State → product / interventionState → продукт / вмешательство	RAG + Llama 3 70B	B	NoНет	✓
Checkout AgentАгент заказа	Checkout, POS sync, inventoryЧекаут, POS-синк, инвентарь	Rule + GPT-4o-mini	B	Yes — confirmationДа — подтверждение	✓
CRM AgentАгент CRM	Tags, cohorts, profileТеги, когорты, профиль	GPT-4o-mini	C	NoНет	✓
Campaigns AgentАгент кампаний	Trigger sequences, pushТриггерные рассылки, push	Llama 3 8B	C	NoНет	✓
Inventory AgentАгент инвентаря	Replenishment, forecastПополнение склада, прогноз	Rule-based + LLM	C	NoНет	✓
Voice StackГолосовой стек	Vapi: call without appVapi: звонок без приложения	Eleven Labs + Vapi	Voice	NoНет	✓
Audit AgentАгент аудита	Immutable trace, compliance logImmutable trace, compliance log	Always onВсегда активен	—	—	✓
Alter Ego (v2)	Digital copy of customer in store/homeЦифровая копия клиента в магазине/дома	Tier A (future)	A	PartialЧастично	Post-MVP

Architecture pattern (Mermaid)Паттерн архитектуры (Mermaid)

    flowchart TD

      SIG[Customer Signals · voice · wearables · behaviorСигналы клиента · голос · wearables · поведение]

      SIA[State Detection · State ObjectДетекция состояния · State Object]

      ORC[ORCHESTRATOR · Claude 3.5 · Tier A]

      SAF[Safety · MindGuard]  CON[Conversation · Llama 3]  REC[Recommendation · RAG]

      CHK[Checkout · POS]  CRM[CRM · Tags]  CAM[Campaigns · Push]  INV[Inventory]

      AUD[Audit · always onвсегда]  VOI[Vapi · Eleven Labs]

      SIG --> SIA --> ORC

      ORC --> SAF & CON & REC & CHK & CRM & CAM & INV & AUD

      CON --> VOI

Product Flows → Agent ChainsПродуктовые флоу → Цепочки агентов

Retail: unknown customerРозница: неизвестный клиент

01

ChainЦепочка

State Detection → Conversation → Recommendation → CRM Tag

Fallback

Sales script for staffСкрипт для продавца

Retail: known / touristРозница: известный / турист

02

ChainЦепочка

Context Retrieval → Recommendation → Upsell → Inventory check

Fallback

Standard offerСтандартное предложение

Checkout confirmationПодтверждение покупки

03

ChainЦепочка

Checkout → POS sync → Inventory decrement → CRM update → Campaign trigger

Fallback

Manual checkout + deferred syncРучной чекаут + отложенный синк

Home: stress / anxiety (HRV 42ms)Дома: стресс / тревога (HRV 42ms)

04

ChainЦепочка

State Detection → Conversation → Recommendation → Safety gate

Fallback

Escalation to specialistЭскалация к специалисту

Home: sleep degradation (5h50m)Дома: нарушение сна (5ч50м)

05

ChainЦепочка

State Detection → Recommendation → Outcome tracking → Campaign

Fallback

Push + manual follow-upPush + ручной follow-up

Store: customer wants to relaxМагазин: клиент хочет расслабиться

06

ChainЦепочка

State Detection → Recommendation (CBD bundle) → Checkout

Fallback

Staff with scriptПродавец по скрипту

⚠ Crisis situation⚠ Критическая ситуация

07

ChainЦепочка

Safety Agent → Human escalation → Audit log

Fallback

Always humanВсегда человек

Voice Stack — Vapi + Eleven LabsГолосовой стек — Vapi + Eleven Labs

Key requirement (meeting 12.05):Ключевое требование (митинг 12.05): Customer calls or speaks in the store — without installing the app. Vapi solves the "telephone customer" problem. Клиент звонит или говорит в магазине — без установки приложения. Vapi решает задачу «телефонного клиента».

Vapi

Telephony: inbound/outbound calls via AI agentТелефония: входящие/исходящие звонки через AI-агента

Tool for agent — decides itself when to callTool для агента — решает сам когда позвонить

Eleven Labs

Voice synthesis — indistinguishable from humanСинтез голоса — неотличимо от человека

Customisable voice for Alter Ego / brandНастраиваемый голос под Alter Ego / бренд

MultilingualМногоязычность

EN / RU / TH / UK

Auto-response in customer language. Priority for Weeden — tourists from different countriesАвто-ответ на языке клиента. Приоритет для Weeden — туристы из разных стран

Token saving (Rust)

20–40% cost reduction on voice sessionsСнижение затрат 20–40% на голосовых сессиях

Apply as dependency in agent runtimeПрименять как зависимость в агентном runtime

Infrastructure — GCP baseline + Azure optionИнфраструктура — GCP baseline + Azure опция

API / Auth

Cloud Endpoints / APIM

API Gateway + JWT/OAuth

✓ MVP

Agent RuntimeАгентный runtime

Cloud Run / ACI / EKS

Orchestrator + Agent poolОркестратор + пул агентов

✓ MVP

Model Gateway

Vertex AI / Azure OpenAI / Bedrock

Tier A/B/C router

✓ MVP

Event Bus

Pub/Sub / Kafka / SQS

Async tasks between agentsAsync задачи между агентами

✓ MVP

Vector Store / RAG

Pinecone / Weaviate / AlloyDB

Embeddings

✓ MVP

Profile / State DB

Firestore / CosmosDB

Customer context storeКонтекстное хранилище клиента

✓ MVP

Observability

Cloud Trace / Datadog

Traces, metrics, alertsТрейсы, метрики, алерты

✓ MVP

Audit Ledger

BigQuery / Blob immutable

PDPA complianceСоответствие PDPA

✓ MVP

Edge / Offline

Gemma / Llama on-device

Gemma API

Post-MVP

BYOK

Customer brings own model keyКлиент приносит свой ключ модели

Provider abstraction

Post-MVP

Retail hardwareОборудование ритейла

DeviceУстройство	PurposeНазначение	Status
Tablet (staffпродавец)	Agent recommendation display for budtenderДисплей рекомендаций агента для бадтендера	MVP
Camera (CV)	Behavioural detection of unknown customerДетекция поведения неизвестного клиента	MVP opt.
POS	Order sync, inventory, CRMСинк заказа, инвентаря, CRM	MVP
Display / screenДисплей / экран	Visual AI persona / Alter Ego for customerВизуальный AI-персонаж / Alter Ego для клиента	Post-MVP
Edge device	Local model without internetЛокальная модель при отсутствии интернета	Post-MVP

Model Tier RoutingТировая маршрутизация моделей

TierТир	AgentsАгенты	ModelsМодели	~Cost / 1K tokens~Стоимость / 1K	Cost controlsКонтроль затрат
A — High	Orchestrator, Safety, Clinical triageОркестратор, Безопасность, Клиническая триаж	Claude 3.5 Sonnet / GPT-4o	$0.015–0.060	Strict thresholds · gates before callСтрогие пороги · гейты перед вызовом
B — Medium	Conversation, Recommendation, CheckoutРазговор, Рекомендации, Чекаут	Llama 3 70B / GPT-4o-mini	$0.001–0.008	Context pruning · session cacheПрунинг контекста · сессионный кэш
C — Low	CRM tags, Campaigns, InventoryCRM-теги, Кампании, Инвентарь	Llama 3 8B / GPT-4o-mini	<$0.001	Batching · templates · cheap pipelineБатчинг · шаблоны · дешёвый pipeline
Voice	Vapi + Eleven Labs	Eleven Labs TTS + Vapi	$0.05–0.12 / min	Compression · token saving (Rust)Сжатие · token saving (Rust)

Traffic scenariosСценарии трафика

ScenarioСценарий	Transactions / moТранзакций / мес	Model strategyСтратегия моделей	Main cost driversОсновные драйверы
POC / Low	~1 000	Frontier-heavy (testing)Frontier-heavy (тестирование)	Experimental Tier A callsЭкспериментальные вызовы Tier A
Launch / MVP	~10 000	Hybrid: Tier A rarely, B/C mainГибрид: Tier A редко, B/C основные	Vapi voice sessionsГолосовые сессии Vapi
Scale	~100 000+	Small-model Tier C optimisationSmall-model оптимизация Tier C	Context window bloatContext window bloat

Cost-saving techniquesКлючевые приёмы экономии

Token saving (Rust)

Apply as agent runtime dependency — 20–40% savings on voiceПрименять как зависимость — экономия 20–40% на голосе

Context pruning

Trim history > N messages, keep only summary + key factsОбрезать историю > N сообщений, хранить только summary + ключевые факты

Session distillation

After session: save distillate, not full logПосле сессии: сохранять дистиллят, не полный лог

Confidence-based escalation

Tier C → B → A only on low confidenceTier C → B → A только при низкой уверенности

Embedding cache

Frequent products / protocols — no recalculation each timeЧастые продукты / протоколы — не пересчитывать каждый раз

BYOK

Customer brings own model key — reduces COGS at scaleКлиент приносит свой ключ — снижает COGS при масштабе

Buy vs Build

ComponentКомпонент	DecisionРешение	RationaleОбоснование
Model API (LLM)	BUY OpenAI / Anthropic / GCP	Faster, not our moat; abstraction allows provider swapБыстрее, не наш moat; абстракция позволяет менять провайдера
Voice stackГолосовой стек	BUY Vapi / Eleven Labs	Already production-ready; integrate as agent toolУже production-ready; интеграция как tool для агента
Orchestration	BUY LangGraph / AutoGen / CrewAI	Don't reinvent the wheel; tested patternsНе изобретать велосипед; протестированные паттерны
Vector Store / RAG	BUY Pinecone / Weaviate	Commodity; only prompt quality tuning mattersCommodity; критично только quality тюнинг промптов
CRM / ERP / POS	BUY existing client systemsсуществующие системы клиента	Integrate via adapters, don't replaceИнтегрировать через адаптеры, не заменять
Safety / Guardrails	BUY MindGuard / NeMo	Clinically tested; don't build yourselfКлинически протестированы; самостоятельно не строить
State Detection	BUILD our core IPнаш core IP	Unique link state→agent→outcome — our moatУникальная связка state→agent→outcome — наш moat
Outcome tracking	BUILD data flywheel	state→product→outcome data — long-term advantageДанные state→product→outcome — долгосрочное преимущество
Agent tool connectors	BUILD thin adapters	Weeden / Humanist specifics; easy but neededСпецифика Weeden / Humanist; несложно, но нужно
Alter Ego / SA profile	BUILD Post-MVP	Unique personalisation; start after Mode 1Уникальная персонализация; стартовать после Mode 1

Mode 1 vs Mode 2Два режима работы

ParameterПараметр	Mode 1: HITL — MVP	Mode 2: Self-Service — Post-MVP
Agent chain ends atЦепочка заканчивается на	«Recommendation to staff»«Рекомендация продавцу»	«Autonomous action»«Автономное действие»
Decision authorityАвторитет решений	Human (staff / customer explicitly confirms)Человек (продавец / клиент явно подтверждает)	AI agent under policy supervisionAI-агент под надзором политик
Operational riskОперационный риск	Low — human filters errorsНизкий — человек фильтрует ошибки	High — need robust fail-safesВысокий — нужны надёжные fail-safes
Response speedСкорость ответа	Slower (waiting for confirmation)Медленнее (ожидание подтверждения)	Instant (machine speed)Мгновенно (скорость машины)
Launch goalЦель запуска	Validation + staff productivityВалидация + продуктивность персонала	Scale + COGS reductionМасштаб + снижение COGS
When to switchКогда переходить	NOW (MVP)СЕЙЧАС (MVP)	After 3–6 months of Mode 1 dataПосле 3–6 мес. данных Mode 1

Recommendation:Рекомендация: Launch Mode 1. Collect data on successful agent decisions. Move specific scenarios to Mode 2 only after AI consistently meets or exceeds human decision quality. Запустить Mode 1. Собрать данные об успешных агентных решениях. Переводить конкретные сценарии в Mode 2 только после того, как AI стабильно превышает или соответствует качеству человеческих решений.

MVP Scope — What we build nowСкоп MVP — Что строим сейчас

✅

MVP — NowMVP — Сейчас

CEM (6 entities)CEM (6 сущностей)

Orchestrator + 8 core subagentsОркестратор + 8 ключевых субагентов

Retail assisted flow (unknown / known / checkout)Retail assisted flow (unknown / known / checkout)

Home: stress + sleep flowsДома: стресс + сон

Vapi voice stackголосовой стек

CRM / POS / Inventory connectorsБазовые коннекторы CRM/POS/Inventory

Static model tier routingСтатическая тировая маршрутизация

Audit logs + Safety Agent

→

Post-MVPPost-MVP

Alter Ego automationАвтоматизация Alter Ego

Dynamic routing 15+ modelsДинамическая маршрутизация 15+ моделей

Adaptive multi-agent networkАдаптивная мультиагентная сеть

Clinical Agent (FHIR)

Edge / offline modelsEdge / offline модели

BYOK

✗

Not nowНе сейчас

Self-improving RL loopsSelf-improving RL loops

High-risk clinical automation without validationВысокорисковая клиническая автоматизация без валидации

Fully autonomous Mode 2 without Mode 1 dataПолностью автономный Mode 2 без данных Mode 1

Open Questions & AssumptionsОткрытые вопросы и допущения

AssumptionДопущение

Azure — main cloud provider (HIPAA-compliance)Azure — основной облачный провайдер (HIPAA-compliance)

Owner:Кто отвечает: Roman + Artem

AssumptionДопущение

Mode 1 gives 20–30% staff efficiency gain — needs validationMode 1 даёт 20–30% рост эффективности персонала — нужна валидация

Owner:Кто отвечает: Team

QuestionВопрос

Will ERP/CRM handle latency < 2s for voice sessions?Выдержат ли ERP/CRM latency < 2 сек для голосовых сессий?

Owner:Кто отвечает: Roman + Andrei

QuestionВопрос

MVP KPI hierarchy: conversion / retention / revenue / frequency?KPI иерархия MVP: конверсия / удержание / доход / частота?

Owner:Кто отвечает: Artem + Tonya

QuestionВопрос

Duty-to-protect thresholds for mental health in Thailand and Ukraine?Пороги duty-to-protect по mental health в Таиланде и Украине?

Owner:Кто отвечает: Artem + specialists

QuestionВопрос

Mode 1 operating model: who approves which actions?Операционная модель Mode 1: кто и какие действия утверждает?

Owner:Кто отвечает: Tonya + Danil

QuestionВопрос

Alter Ego — internal build or partnership with Mironov?Alter Ego — внутренний build или партнёрство с Мироновым?

Owner:Кто отвечает: Artem

Friday Review — Talking Points (5–7 min)Пятничный ревью — Talking Points (5–7 минут)

1

ARCHITECTURE

One pattern — Supervisor-Worker — works for both retail and mental health. Same agents, different configuration.Один паттерн — Supervisor-Worker — работает для ритейла и mental health. Те же агенты, разная конфигурация.

2

STATE-TRIGGERED

Customer names a state (stress, sleep, relaxation) → system launches a chain. This is our differentiator, not just a chatbot.Клиент называет состояние (стресс, сон, расслабление) → система запускает цепочку. Это наш differentiator, не просто чат-бот.

3

VAPI / VOICE

Customer in-store or on the phone — without installing the app. Vapi + Eleven Labs solves it now.Клиент в магазине или по телефону — без установки приложения. Vapi + Eleven Labs решает задачу сейчас.

4

MODE 1 FIRST

Launch with HITL. Human approves critical actions. Move to autonomy only after data.Запускаем с HITL. Человек утверждает критичные действия. Переходим к автономии только после данных.

5

COST

Three model tiers: A (expensive, rare), B (medium, dialogue), C (cheap, automation). Vapi — main voice cost driver.Три тира моделей: A (дорогой, редко), B (средний, диалог), C (дешёвый, автоматика). Vapi — основной голосовой драйвер затрат.

6

MVP SCOPE

8 agents + 2 flows (retail + home). Alter Ego and clinical — after MVP. Team and timeline estimation can start.8 агентов + 2 флоу (retail + home). Alter Ego и clinical — после MVP. Можно начать оценку команды и сроков.

AI Agent ArchitectureАрхитектура AI-агентов