Summary:Резюме:
AMA Digital builds a unified AI stack for two products — Weeden (cannabis retail, Thailand) and Humanist (mental wellness) — on a shared technology core. Core innovation: customer State Object triggers a coordinated agent chain — in-store, at home, and in the clinic.
AMA Digital строит единый AI-стек для двух продуктов — Weeden (cannabis retail, Таиланд) и Humanist (mental wellness) — на общем технологическом ядре. Ключевая инновация: State Object клиента запускает скоординированную цепочку агентов — в магазине, дома, в клинике.
Key DecisionsКлючевые решения
| AreaОбласть | DecisionРешение |
| ProductsПродукты | Weeden Retail AI + Humanist 2.0 — one tech stack, two UX tracksWeeden Retail AI + Humanist 2.0 — один технологический стек, два UX-трека |
| ArchitectureАрхитектура | Supervisor-Worker (orchestrator + subagents) — same pattern for retail and mental healthSupervisor-Worker (оркестратор + субагенты) — одинаковый паттерн для ритейла и mental health |
| LaunchЗапуск | Mode 1 (HITL): human approves critical actions → move to Mode 2 after validationMode 1 (HITL): человек утверждает критичные действия → переход к Mode 2 после валидации |
| Voice / PhoneГолос / Телефон | Vapi + Eleven Labs — customer talks to AI without installing the appVapi + Eleven Labs — клиент разговаривает с AI без установки приложения |
| Friday deadlineДедлайн | Diagrams ready → next week: people, money, timeline estimatesДиаграммы готовы → следующая неделя: оценки людей, денег, сроков |
Three Value AxesТри оси ценности
SleepСон
Sleep ≥6h45m · Deep ≥55mСон ≥6ч45м · Глубокий ≥55м
Humanist App + Weeden CBD/sleep bundleHumanist App + Weeden CBD/sleep bundle
StressСтресс
HRV ↑ 42ms → 60ms
Mental Health Agent + Retail consultMental Health Agent + Retail consult
Emotional HealthЭмоц. здоровье
Mood score + journaling frequencyMood score + частота журналирования
Conversation Agent + Outcome trackingConversation Agent + Outcome tracking
Canonical Entity ModelКаноническая модель сущностей
| EntityСущность | ResponsibilityОтветственность | Key DataКлючевые данные | InterfacesИнтерфейсы |
| Customer / StateКлиент / State | State, profile, history, consentСостояние, профиль, история, согласие | State Object, profile, history | All channelsВсе каналы |
| Home / Device (SA)Дом / Устройство (SA) | Mental health conversation, tracking, follow-upРазговор, трекинг, follow-up | Wearable data, journal, state logWearable, журнал, лог состояний | Voice, App, Push |
| Store Agent (Weeden)Агент магазина | In-store detection, recommendation, checkoutДетекция в магазине, рекомендация, чекаут | Product catalog, transaction, tagsКаталог, транзакция, теги | Tablet, POS, Camera |
| Clinical AgentКлинический агент | Transfer clinical context to specialistПередача клинического контекста специалисту | FHIR/OMOP, clinical notes | EMR, Clinic UI |
| Enterprise CoreЯдро предприятия | Orchestration, policies, routing, auditОркестрация, политики, маршрутизация, аудит | Event log, policy rules, KPIs | Event bus, APIs |
| Systems of RecordСистемы учёта | CRM, POS/ERP, inventory, campaignsинвентарь, кампании | Transactional truth, campaignsТранзакционная правда, кампании | CRM, ERP, WMS |
| Comms LayerКоммуникации | Voice, SMS, Push, multilingual responseГолос, SMS, Push, многоязычный ответ | Session, language, channel prefСессия, язык, предпочтения канала | Vapi/Twilio |
Agent Catalog — 12 agents · Supervisor-Worker patternКаталог агентов — 12 агентов · паттерн Supervisor-Worker
| AgentАгент |
RoleРоль |
Model / ToolМодель / Инструмент |
TierТир |
HITL |
MVP |
| OrchestratorОркестратор |
Planning, policy, routingПланирование, политика, маршрутизация |
Claude 3.5 Sonnet / GPT-4o |
A |
No (auto)Нет (авто) |
✓ |
| State DetectionДетекция состояния |
State Object from signalsState Object из сигналов |
GPT-4o-mini + CV API |
B |
NoНет |
✓ |
| Safety AgentАгент безопасности |
Crisis detection, PDPA, escalationКризис, PDPA, эскалация |
MindGuard + Tier A fallback |
A |
Yes — escalationДа — эскалация |
✓ |
| Conversation AgentАгент разговора |
Dialogue: voice + text, Alter EgoДиалог: голос + текст, Alter Ego |
Llama 3 70B / GPT-4o-mini |
B |
NoНет |
✓ |
| Recommendation AgentАгент рекомендаций |
State → product / interventionState → продукт / вмешательство |
RAG + Llama 3 70B |
B |
NoНет |
✓ |
| Checkout AgentАгент заказа |
Checkout, POS sync, inventoryЧекаут, POS-синк, инвентарь |
Rule + GPT-4o-mini |
B |
Yes — confirmationДа — подтверждение |
✓ |
| CRM AgentАгент CRM |
Tags, cohorts, profileТеги, когорты, профиль |
GPT-4o-mini |
C |
NoНет |
✓ |
| Campaigns AgentАгент кампаний |
Trigger sequences, pushТриггерные рассылки, push |
Llama 3 8B |
C |
NoНет |
✓ |
| Inventory AgentАгент инвентаря |
Replenishment, forecastПополнение склада, прогноз |
Rule-based + LLM |
C |
NoНет |
✓ |
| Voice StackГолосовой стек |
Vapi: call without appVapi: звонок без приложения |
Eleven Labs + Vapi |
Voice |
NoНет |
✓ |
| Audit AgentАгент аудита |
Immutable trace, compliance logImmutable trace, compliance log |
Always onВсегда активен |
— |
— |
✓ |
| Alter Ego (v2) |
Digital copy of customer in store/homeЦифровая копия клиента в магазине/дома |
Tier A (future) |
A |
PartialЧастично |
Post-MVP |
Architecture pattern (Mermaid)Паттерн архитектуры (Mermaid)
flowchart TD
SIG[Customer Signals · voice · wearables · behaviorСигналы клиента · голос · wearables · поведение]
SIA[State Detection · State ObjectДетекция состояния · State Object]
ORC[ORCHESTRATOR · Claude 3.5 · Tier A]
SAF[Safety · MindGuard] CON[Conversation · Llama 3] REC[Recommendation · RAG]
CHK[Checkout · POS] CRM[CRM · Tags] CAM[Campaigns · Push] INV[Inventory]
AUD[Audit · always onвсегда] VOI[Vapi · Eleven Labs]
SIG --> SIA --> ORC
ORC --> SAF & CON & REC & CHK & CRM & CAM & INV & AUD
CON --> VOI
Product Flows → Agent ChainsПродуктовые флоу → Цепочки агентов
Retail: unknown customerРозница: неизвестный клиент
01
ChainЦепочка
State Detection → Conversation → Recommendation → CRM Tag
Fallback
Sales script for staffСкрипт для продавца
Retail: known / touristРозница: известный / турист
02
ChainЦепочка
Context Retrieval → Recommendation → Upsell → Inventory check
Fallback
Standard offerСтандартное предложение
Checkout confirmationПодтверждение покупки
03
ChainЦепочка
Checkout → POS sync → Inventory decrement → CRM update → Campaign trigger
Fallback
Manual checkout + deferred syncРучной чекаут + отложенный синк
Home: stress / anxiety (HRV 42ms)Дома: стресс / тревога (HRV 42ms)
04
ChainЦепочка
State Detection → Conversation → Recommendation → Safety gate
Fallback
Escalation to specialistЭскалация к специалисту
Home: sleep degradation (5h50m)Дома: нарушение сна (5ч50м)
05
ChainЦепочка
State Detection → Recommendation → Outcome tracking → Campaign
Fallback
Push + manual follow-upPush + ручной follow-up
Store: customer wants to relaxМагазин: клиент хочет расслабиться
06
ChainЦепочка
State Detection → Recommendation (CBD bundle) → Checkout
Fallback
Staff with scriptПродавец по скрипту
⚠ Crisis situation⚠ Критическая ситуация
07
ChainЦепочка
Safety Agent → Human escalation → Audit log
Fallback
Always humanВсегда человек
Voice Stack — Vapi + Eleven LabsГолосовой стек — Vapi + Eleven Labs
Key requirement (meeting 12.05):Ключевое требование (митинг 12.05):
Customer calls or speaks in the store — without installing the app. Vapi solves the "telephone customer" problem.
Клиент звонит или говорит в магазине — без установки приложения. Vapi решает задачу «телефонного клиента».
Vapi
Telephony: inbound/outbound calls via AI agentТелефония: входящие/исходящие звонки через AI-агента
Tool for agent — decides itself when to callTool для агента — решает сам когда позвонить
Eleven Labs
Voice synthesis — indistinguishable from humanСинтез голоса — неотличимо от человека
Customisable voice for Alter Ego / brandНастраиваемый голос под Alter Ego / бренд
MultilingualМногоязычность
EN / RU / TH / UK
Auto-response in customer language. Priority for Weeden — tourists from different countriesАвто-ответ на языке клиента. Приоритет для Weeden — туристы из разных стран
Token saving (Rust)
20–40% cost reduction on voice sessionsСнижение затрат 20–40% на голосовых сессиях
Apply as dependency in agent runtimeПрименять как зависимость в агентном runtime
Infrastructure — GCP baseline + Azure optionИнфраструктура — GCP baseline + Azure опция
API / Auth
Cloud Endpoints / APIM
API Gateway + JWT/OAuth
✓ MVP
Agent RuntimeАгентный runtime
Cloud Run / ACI / EKS
Orchestrator + Agent poolОркестратор + пул агентов
✓ MVP
Model Gateway
Vertex AI / Azure OpenAI / Bedrock
Tier A/B/C router
✓ MVP
Event Bus
Pub/Sub / Kafka / SQS
Async tasks between agentsAsync задачи между агентами
✓ MVP
Vector Store / RAG
Pinecone / Weaviate / AlloyDB
Embeddings
✓ MVP
Profile / State DB
Firestore / CosmosDB
Customer context storeКонтекстное хранилище клиента
✓ MVP
Observability
Cloud Trace / Datadog
Traces, metrics, alertsТрейсы, метрики, алерты
✓ MVP
Audit Ledger
BigQuery / Blob immutable
PDPA complianceСоответствие PDPA
✓ MVP
Edge / Offline
Gemma / Llama on-device
Gemma API
Post-MVP
BYOK
Customer brings own model keyКлиент приносит свой ключ модели
Provider abstraction
Post-MVP
Retail hardwareОборудование ритейла
| DeviceУстройство | PurposeНазначение | Status |
| Tablet (staffпродавец) | Agent recommendation display for budtenderДисплей рекомендаций агента для бадтендера | MVP |
| Camera (CV) | Behavioural detection of unknown customerДетекция поведения неизвестного клиента | MVP opt. |
| POS | Order sync, inventory, CRMСинк заказа, инвентаря, CRM | MVP |
| Display / screenДисплей / экран | Visual AI persona / Alter Ego for customerВизуальный AI-персонаж / Alter Ego для клиента | Post-MVP |
| Edge device | Local model without internetЛокальная модель при отсутствии интернета | Post-MVP |
Model Tier RoutingТировая маршрутизация моделей
| TierТир | AgentsАгенты | ModelsМодели | ~Cost / 1K tokens~Стоимость / 1K | Cost controlsКонтроль затрат |
| A — High |
Orchestrator, Safety, Clinical triageОркестратор, Безопасность, Клиническая триаж |
Claude 3.5 Sonnet / GPT-4o |
$0.015–0.060 |
Strict thresholds · gates before callСтрогие пороги · гейты перед вызовом |
| B — Medium |
Conversation, Recommendation, CheckoutРазговор, Рекомендации, Чекаут |
Llama 3 70B / GPT-4o-mini |
$0.001–0.008 |
Context pruning · session cacheПрунинг контекста · сессионный кэш |
| C — Low |
CRM tags, Campaigns, InventoryCRM-теги, Кампании, Инвентарь |
Llama 3 8B / GPT-4o-mini |
<$0.001 |
Batching · templates · cheap pipelineБатчинг · шаблоны · дешёвый pipeline |
| Voice |
Vapi + Eleven Labs |
Eleven Labs TTS + Vapi |
$0.05–0.12 / min |
Compression · token saving (Rust)Сжатие · token saving (Rust) |
Traffic scenariosСценарии трафика
| ScenarioСценарий | Transactions / moТранзакций / мес | Model strategyСтратегия моделей | Main cost driversОсновные драйверы |
| POC / Low | ~1 000 | Frontier-heavy (testing)Frontier-heavy (тестирование) | Experimental Tier A callsЭкспериментальные вызовы Tier A |
| Launch / MVP | ~10 000 | Hybrid: Tier A rarely, B/C mainГибрид: Tier A редко, B/C основные | Vapi voice sessionsГолосовые сессии Vapi |
| Scale | ~100 000+ | Small-model Tier C optimisationSmall-model оптимизация Tier C | Context window bloatContext window bloat |
Cost-saving techniquesКлючевые приёмы экономии
Token saving (Rust)
Apply as agent runtime dependency — 20–40% savings on voiceПрименять как зависимость — экономия 20–40% на голосе
Context pruning
Trim history > N messages, keep only summary + key factsОбрезать историю > N сообщений, хранить только summary + ключевые факты
Session distillation
After session: save distillate, not full logПосле сессии: сохранять дистиллят, не полный лог
Confidence-based escalation
Tier C → B → A only on low confidenceTier C → B → A только при низкой уверенности
Embedding cache
Frequent products / protocols — no recalculation each timeЧастые продукты / протоколы — не пересчитывать каждый раз
BYOK
Customer brings own model key — reduces COGS at scaleКлиент приносит свой ключ — снижает COGS при масштабе
Buy vs Build
| ComponentКомпонент | DecisionРешение | RationaleОбоснование |
| Model API (LLM) | BUY OpenAI / Anthropic / GCP | Faster, not our moat; abstraction allows provider swapБыстрее, не наш moat; абстракция позволяет менять провайдера |
| Voice stackГолосовой стек | BUY Vapi / Eleven Labs | Already production-ready; integrate as agent toolУже production-ready; интеграция как tool для агента |
| Orchestration | BUY LangGraph / AutoGen / CrewAI | Don't reinvent the wheel; tested patternsНе изобретать велосипед; протестированные паттерны |
| Vector Store / RAG | BUY Pinecone / Weaviate | Commodity; only prompt quality tuning mattersCommodity; критично только quality тюнинг промптов |
| CRM / ERP / POS | BUY existing client systemsсуществующие системы клиента | Integrate via adapters, don't replaceИнтегрировать через адаптеры, не заменять |
| Safety / Guardrails | BUY MindGuard / NeMo | Clinically tested; don't build yourselfКлинически протестированы; самостоятельно не строить |
| State Detection | BUILD our core IPнаш core IP | Unique link state→agent→outcome — our moatУникальная связка state→agent→outcome — наш moat |
| Outcome tracking | BUILD data flywheel | state→product→outcome data — long-term advantageДанные state→product→outcome — долгосрочное преимущество |
| Agent tool connectors | BUILD thin adapters | Weeden / Humanist specifics; easy but neededСпецифика Weeden / Humanist; несложно, но нужно |
| Alter Ego / SA profile | BUILD Post-MVP | Unique personalisation; start after Mode 1Уникальная персонализация; стартовать после Mode 1 |
Mode 1 vs Mode 2Два режима работы
| ParameterПараметр | Mode 1: HITL — MVP | Mode 2: Self-Service — Post-MVP |
| Agent chain ends atЦепочка заканчивается на | «Recommendation to staff»«Рекомендация продавцу» | «Autonomous action»«Автономное действие» |
| Decision authorityАвторитет решений | Human (staff / customer explicitly confirms)Человек (продавец / клиент явно подтверждает) | AI agent under policy supervisionAI-агент под надзором политик |
| Operational riskОперационный риск | Low — human filters errorsНизкий — человек фильтрует ошибки | High — need robust fail-safesВысокий — нужны надёжные fail-safes |
| Response speedСкорость ответа | Slower (waiting for confirmation)Медленнее (ожидание подтверждения) | Instant (machine speed)Мгновенно (скорость машины) |
| Launch goalЦель запуска | Validation + staff productivityВалидация + продуктивность персонала | Scale + COGS reductionМасштаб + снижение COGS |
| When to switchКогда переходить | NOW (MVP)СЕЙЧАС (MVP) | After 3–6 months of Mode 1 dataПосле 3–6 мес. данных Mode 1 |
Recommendation:Рекомендация:
Launch Mode 1. Collect data on successful agent decisions. Move specific scenarios to Mode 2 only after AI consistently meets or exceeds human decision quality.
Запустить Mode 1. Собрать данные об успешных агентных решениях. Переводить конкретные сценарии в Mode 2 только после того, как AI стабильно превышает или соответствует качеству человеческих решений.
MVP Scope — What we build nowСкоп MVP — Что строим сейчас
CEM (6 entities)CEM (6 сущностей)
Orchestrator + 8 core subagentsОркестратор + 8 ключевых субагентов
Retail assisted flow (unknown / known / checkout)Retail assisted flow (unknown / known / checkout)
Home: stress + sleep flowsДома: стресс + сон
Vapi voice stackголосовой стек
CRM / POS / Inventory connectorsБазовые коннекторы CRM/POS/Inventory
Static model tier routingСтатическая тировая маршрутизация
Audit logs + Safety Agent
Alter Ego automationАвтоматизация Alter Ego
Dynamic routing 15+ modelsДинамическая маршрутизация 15+ моделей
Adaptive multi-agent networkАдаптивная мультиагентная сеть
Clinical Agent (FHIR)
Edge / offline modelsEdge / offline модели
BYOK
Self-improving RL loopsSelf-improving RL loops
High-risk clinical automation without validationВысокорисковая клиническая автоматизация без валидации
Fully autonomous Mode 2 without Mode 1 dataПолностью автономный Mode 2 без данных Mode 1
Open Questions & AssumptionsОткрытые вопросы и допущения
AssumptionДопущение
Azure — main cloud provider (HIPAA-compliance)Azure — основной облачный провайдер (HIPAA-compliance)
Owner:Кто отвечает: Roman + Artem
AssumptionДопущение
Mode 1 gives 20–30% staff efficiency gain — needs validationMode 1 даёт 20–30% рост эффективности персонала — нужна валидация
Owner:Кто отвечает: Team
QuestionВопрос
Will ERP/CRM handle latency < 2s for voice sessions?Выдержат ли ERP/CRM latency < 2 сек для голосовых сессий?
Owner:Кто отвечает: Roman + Andrei
QuestionВопрос
MVP KPI hierarchy: conversion / retention / revenue / frequency?KPI иерархия MVP: конверсия / удержание / доход / частота?
Owner:Кто отвечает: Artem + Tonya
QuestionВопрос
Duty-to-protect thresholds for mental health in Thailand and Ukraine?Пороги duty-to-protect по mental health в Таиланде и Украине?
Owner:Кто отвечает: Artem + specialists
QuestionВопрос
Mode 1 operating model: who approves which actions?Операционная модель Mode 1: кто и какие действия утверждает?
Owner:Кто отвечает: Tonya + Danil
QuestionВопрос
Alter Ego — internal build or partnership with Mironov?Alter Ego — внутренний build или партнёрство с Мироновым?
Owner:Кто отвечает: Artem
Friday Review — Talking Points (5–7 min)Пятничный ревью — Talking Points (5–7 минут)
1
ARCHITECTURE
One pattern — Supervisor-Worker — works for both retail and mental health. Same agents, different configuration.Один паттерн — Supervisor-Worker — работает для ритейла и mental health. Те же агенты, разная конфигурация.
2
STATE-TRIGGERED
Customer names a state (stress, sleep, relaxation) → system launches a chain. This is our differentiator, not just a chatbot.Клиент называет состояние (стресс, сон, расслабление) → система запускает цепочку. Это наш differentiator, не просто чат-бот.
3
VAPI / VOICE
Customer in-store or on the phone — without installing the app. Vapi + Eleven Labs solves it now.Клиент в магазине или по телефону — без установки приложения. Vapi + Eleven Labs решает задачу сейчас.
4
MODE 1 FIRST
Launch with HITL. Human approves critical actions. Move to autonomy only after data.Запускаем с HITL. Человек утверждает критичные действия. Переходим к автономии только после данных.
5
COST
Three model tiers: A (expensive, rare), B (medium, dialogue), C (cheap, automation). Vapi — main voice cost driver.Три тира моделей: A (дорогой, редко), B (средний, диалог), C (дешёвый, автоматика). Vapi — основной голосовой драйвер затрат.
6
MVP SCOPE
8 agents + 2 flows (retail + home). Alter Ego and clinical — after MVP. Team and timeline estimation can start.8 агентов + 2 флоу (retail + home). Alter Ego и clinical — после MVP. Можно начать оценку команды и сроков.