commit 9e9d586d6d6383a1791683e544d3b61bb46b21b5 Author: Ruslan Vasilyev Date: Wed May 13 12:35:42 2026 +0300 refresh: 2026-05-13 — 10 files diff --git a/.github/workflows/deploy-pages.yml b/.github/workflows/deploy-pages.yml new file mode 100644 index 0000000..962a537 --- /dev/null +++ b/.github/workflows/deploy-pages.yml @@ -0,0 +1,32 @@ +# Deploys the entire repo root to GitHub Pages on every push to master. +# Pattern copied from wasrusgen/zov-tech (which serves the ZOV MiniApp). +name: Deploy ELNY Analytics to GitHub Pages + +on: + push: + branches: [master, main] + workflow_dispatch: + +permissions: + contents: read + pages: write + id-token: write + +concurrency: + group: pages + cancel-in-progress: false + +jobs: + deploy: + environment: + name: github-pages + url: ${{ steps.deployment.outputs.page_url }} + runs-on: ubuntu-latest + steps: + - uses: actions/checkout@v4 + - uses: actions/configure-pages@v5 + - uses: actions/upload-pages-artifact@v3 + with: + path: . + - id: deployment + uses: actions/deploy-pages@v4 diff --git a/.gitignore b/.gitignore new file mode 100644 index 0000000..1f7bf03 --- /dev/null +++ b/.gitignore @@ -0,0 +1,5 @@ +# Big binary artifacts that don't belong in git +*.parquet +*.zip +.DS_Store +Thumbs.db diff --git a/README.md b/README.md new file mode 100644 index 0000000..cfba6b8 --- /dev/null +++ b/README.md @@ -0,0 +1,29 @@ +# ELNY · Аналитика — публичные отчёты + +Статический сайт, который GitHub Pages автоматически собирает из этого репо при каждом пуше в `master`. + +**Живая ссылка:** https://wasrusgen.github.io/elny-analytics/ + +## Что внутри + +| Файл | Что это | +|---|---| +| `index.html` | Главная — редирект на `status.html` | +| `status.html` | Дашборд статуса пайплайна парсинга (real-time состояние данных) | +| `dashboard.html` | Аналитический дашборд по 6 брендам (ELNY + 5 конкурентов) | +| `reports/*.pdf` | Сгенерированные отчёты (конкурентный анализ, brand voice, SEO, AI visibility) | +| `reports/*.xlsx` | Excel-выгрузки (master, brand_voice, Power Query template) | + +## Источник данных + +Файлы публикуются скриптом `scripts/publish_to_gh_pages.py` из основного проекта парсинга: +`D:\! Рабочий стол\ELNY\ПАРСИНГ\` + +Скрипт копирует свежие `exports/*.html` и выбранные отчёты в этот репо, делает `git commit + push` — +GitHub Pages деплоит в течение 1–2 минут. + +## Сырые данные (Parquet) + +Parquet-файлы (master, matches, embeddings, и т.д.) **не** хранятся здесь — они опубликованы на +Yandex.Диске в `/ELNY-Аналитика/data/`. Публичные ссылки на каждый файл — +в `config/share_links.yaml` основного проекта. diff --git a/dashboard.html b/dashboard.html new file mode 100644 index 0000000..66c2644 --- /dev/null +++ b/dashboard.html @@ -0,0 +1,36 @@ + + + + + ELNY: конкурентная аналитика + + + +

ELNY — конкурентная аналитика fashion-сайтов

+

Сводка по 6 интернет-магазинам женской одежды. Снапшот от 2026-05-11. Всего позиций: 7,290.

+
ELNY (наш бренд)
1,375 поз
в наличии: 742 • медиана: 6,000 ₽ • скидок: 54.0%
12storeez
2,040 поз
в нал.: 1991 • мед.: 19,000 ₽ • скидок: 0.0%
annapekun
349 поз
в нал.: 349 • мед.: 2,990 ₽ • скидок: 99.7%
elis
1,028 поз
в нал.: 1019 • мед.: 5,999 ₽ • скидок: 0.0%
emkashop
1,053 поз
в нал.: 931 • мед.: 9,990 ₽ • скидок: 50.0%
pompa
1,445 поз
в нал.: 1445 • мед.: 3,690 ₽ • скидок: 33.9%

Сводка по сайтам

СайтВсегоВ наличииРаспроданоМин ₽Медиана ₽Макс ₽% со скидкой
12storeez2,0401,99117700 ₽19,000 ₽270,000 ₽0.0%
annapekun3493490440 ₽2,990 ₽10,980 ₽99.7%
elis1,0281,0190799 ₽5,999 ₽20,999 ₽0.0%
elny1,3757426331,799 ₽6,000 ₽19,889 ₽54.0%
emkashop1,0539311221,390 ₽9,990 ₽50,990 ₽50.0%
pompa1,4451,4450790 ₽3,690 ₽27,890 ₽33.9%
+
+
+
+
+
+
+
+
\ No newline at end of file diff --git a/index.html b/index.html new file mode 100644 index 0000000..b7a55cc --- /dev/null +++ b/index.html @@ -0,0 +1,17 @@ + + + + +ELNY · Аналитика + + + + +

ELNY · Аналитика

+

Если переадресация не сработала — откройте status.html.

+ + diff --git a/reports/ELNY_PowerQuery_template.xlsx b/reports/ELNY_PowerQuery_template.xlsx new file mode 100644 index 0000000..230171a Binary files /dev/null and b/reports/ELNY_PowerQuery_template.xlsx differ diff --git a/reports/ELNY_ai_visibility_report.pdf b/reports/ELNY_ai_visibility_report.pdf new file mode 100644 index 0000000..2019bda Binary files /dev/null and b/reports/ELNY_ai_visibility_report.pdf differ diff --git a/reports/ELNY_brand_voice_guidelines.pdf b/reports/ELNY_brand_voice_guidelines.pdf new file mode 100644 index 0000000..f9d24da Binary files /dev/null and b/reports/ELNY_brand_voice_guidelines.pdf differ diff --git a/reports/ELNY_competitive_analysis_v2.docx b/reports/ELNY_competitive_analysis_v2.docx new file mode 100644 index 0000000..bd137c6 Binary files /dev/null and b/reports/ELNY_competitive_analysis_v2.docx differ diff --git a/reports/ELNY_competitive_analysis_v2.pdf b/reports/ELNY_competitive_analysis_v2.pdf new file mode 100644 index 0000000..63b48a9 Binary files /dev/null and b/reports/ELNY_competitive_analysis_v2.pdf differ diff --git a/reports/ELNY_executive_deck.pptx b/reports/ELNY_executive_deck.pptx new file mode 100644 index 0000000..0199cad Binary files /dev/null and b/reports/ELNY_executive_deck.pptx differ diff --git a/reports/ELNY_seo_audit.pdf b/reports/ELNY_seo_audit.pdf new file mode 100644 index 0000000..70a6528 Binary files /dev/null and b/reports/ELNY_seo_audit.pdf differ diff --git a/reports/brand_voice.xlsx b/reports/brand_voice.xlsx new file mode 100644 index 0000000..b8fdb67 Binary files /dev/null and b/reports/brand_voice.xlsx differ diff --git a/status.html b/status.html new file mode 100644 index 0000000..04aff9e --- /dev/null +++ b/status.html @@ -0,0 +1,183 @@ + + + +ELNY · Статус проекта + + + +
+ Обновлено: 2026-05-13 12:01 RTZ 2 (зима) + Авто-рефреш каждую минуту +
+

ELNY · Статус проекта

+

Папка: D:\! Рабочий стол\ELNY\ПАРСИНГ

+ +

Пайплайн парсинга

+
+
Последний снапшот
2026-05-11
2 дн назад
+
Master.parquet
7 290
строк · 1 снапшот
+
Снапшотов всего
1
2026-05-11 → 2026-05-11
+
Открытых вопросов
4
см. ниже
+
+ + + + + + + +
СайтФайлРазмерОбновлёнСтрок
12storeezdata/2026-05-11/12storeez.parquet366 KB1 дн назад2040
annapekundata/2026-05-11/annapekun.parquet98 KB1 дн назад349
elisdata/2026-05-11/elis.parquet708 KB1 дн назад1028
elnydata/2026-05-11/elny.parquet333 KB1 дн назад1375
emkashopdata/2026-05-11/emkashop.parquet147 KB1 дн назад1053
pompadata/2026-05-11/pompa.parquet166 KB1 дн назад1445
+
+

Майлстоуны проекта 19 / 20 · 95%

+
+
6 парсинг-адаптеров
+
Master.parquet с нормализацией
+
Состав ткани в % (composition parser)
+
Quality score per product
+
Цветовая палитра нормализована
+
TF-IDF матчинг (text)
+
CLIP матчинг (image)
+
Brand voice analysis
+
Velocity + elasticity (нужно ≥2 снапшота)
+
Streamlit-приложение (8 вкладок)
+
HTML-дашборд
+
Word v2 записка
+
PPTX executive deck
+
AI visibility audit
+
SEO + content audit (через агент)
+
Brand voice guidelines
+
Power Query шаблон
+
Email delivery (SMTP)
+
ELNY-style palette применена
+
Месячный run_monthly.bat
+
+
+

Артефакты в exports/

+ +

Главные отчёты (PDF)

+
Аналитическая записка v24.0 MB · 18 мин назад
📂 Открыть 🔗 Поделиться ✉ Email
+
Executive deck (PPTX)1.5 MB · 16 мин назад
📂 Открыть 🔗 Поделиться ✉ Email
+
Brand voice guidelines4.0 MB · 17 мин назад
📂 Открыть 🔗 Поделиться ✉ Email
+
SEO + content audit4.0 MB · 17 мин назад
📂 Открыть 🔗 Поделиться ✉ Email
+
AI visibility report266 KB · 17 мин назад
📂 Открыть 🔗 Поделиться ✉ Email
+
+

Word-версии (редактируемые)

+
Word v11.1 MB · 18 мин назад
📂 Открыть ✉ Email
+
Word v21.1 MB · 18 мин назад
📂 Открыть 🔗 Поделиться ✉ Email
+
AI visibility (Word)632 KB · 18 мин назад
📂 Открыть ✉ Email
+
SEO audit (Word)1.1 MB · 18 мин назад
📂 Открыть ✉ Email
+
Brand voice (Word)631 KB · 18 мин назад
📂 Открыть ✉ Email
+
+

Инструменты и данные

+
Plotly-дашборд214 KB · 53 мин назад
📂 Открыть 🔗 Поделиться ✉ Email
+
Power Query шаблон12 KB · 53 мин назад
📂 Открыть 🔗 Поделиться ✉ Email
+
Brand voice xlsx20 KB · 18 ч назад
📂 Открыть 🔗 Поделиться ✉ Email
+
Master XLSX (Power BI)2.1 MB · 13 ч назад
📂 Открыть 🔗 Поделиться ✉ Email
+
Master CSV7.5 MB · 13 ч назад
📂 Открыть ✉ Email
+
+
+

Открытые вопросы / известные ограничения

+
12storeez — размеры не извлечены
Из 2040 карточек только 0 имеют размеры. Patched adapter с retry+refresh готов, но 12storeez сегодня нас троттлит. Запустить заново python run.py snapshot --site 12storeez --delay 0.8.
+
ELNY — высокая доля OOS
633 из 1375 (46%) товаров распроданы. Действие: аудит каждой OOS-карточки — архив / Sale-страница / допоставка.
+
SMTP не настроен
Email-уведомления выключены. Установить переменные окружения: SMTP_HOST, SMTP_USER, SMTP_PASS.
+
Diff-отчёты ждут второго снапшота
Сейчас 1 снапшот. Velocity, elasticity и alerts активируются после 2-го прогона (через ~30 дней автоматически).
+
+

Месячный пайплайн

+
+
Следующий запуск
2026-06-01
через 19 дн
+
Получатели email
2
i@wasrusgen.ru, en@elny.ru
+
Прогонов в логе
в logs/
+
+

Пайплайн: snapshot ×6 → mastermatchbrand-voicecolorstrendsexportimages (download → encode → match) → dashboardpowerqueryword v2alerts --email

+
+ +

+ Дашборд автогенерируется командой python run.py status. + Открой этот файл в браузере и оставь — он сам перечитает состояние каждую минуту. +

+ \ No newline at end of file