Что нового в нагрузке?

AWS, своих датацентров никто не строит, специфика Украины - все хостится в облаках, в России - все хостятся у себя. Облачные реалии наступают. В связи с переездом многие вещи. Изменились. Вот я никогда не работает с AWS и тестирование нагрузки в облаках это другое. Вы не понимаете - это другое.

Иллюстрация Тестирование обновления кластера. 1000 - 2000 нод. Squisse, тестирование одной ноды на проде до ее пределов. Потом две ноды. Проверка линейности масшабирования системы.

Берем простые вещи и тестируем сложную систему. Берем ото всех по чуть-чуть и получаем исследование, которое находится на стыке Test и Ops.

Написание тестов на узкое место. Написание маленького теста на проблему.

Команды пугают другие вещи - мы делали-делали, подали нагрузку, а тут вот ... медленно стало. Команды хотят Feature toggle. Тестированеи производительности 1) Проверка по факту 2) Метрики на проде, трейсинг, который покажет, в чем узкое место Arrange, Act, (Assert) !!!!! Сделать более яркий переход между слайдами голосом. Интонацией.

Почему раньше не запускали тесты из Docker? Были проблемы производительности самого Docker. Сейчас он позволяет. Istio, Envoy, balancer, ... Особенно, когда тестируются сервисы развернутые в k8s Разработчик может запустить нагрузку локального с локальной машины разработчика

Много денег надо будет за облако. И для нагрузки становится важно развертывать и свертывать конрут нагрузки.

lithhouse -- для ручной проверки. А тут как LH с мониторингом

- Андрей Похилько - новый инструмент для нагрузки и Mizu.io - отличная утилита для разбора проблем в Kubernetes - Илья Бровкин - новая платформа для Web3 https://www.linkedin.com/in/iliyabrovkin/ - Олесь Писаренко - новый инструмент для нагрузки на GoLang https://www.linkedin.com/in/doctornkz/ - Андрей Сатарин - https://www.linkedin.com/in/asatarin/ тестирование корректности распределенных систем во время обновления и отката версиий в дополнение к стресс-тестированию в помощью unit-тестов, выполняемых во время обновления или масштабирования системы https://asatarin.github.io/talks/2022-09-upgrade-failures-in-distributed-systems/ - Андрей Акиньшин - новая книга Профессиональный бенчмаркинг - Антон Серпутько - работает в США, участвовал в подкасте по производительности https://t.me/dou_qa/484 - Mark Tomlinson - сделал курс по эксплуатационному тестированию производительности, тестирование цель которого в поиске узких мест и записал много новых выпусков подкаста PerfBytes https://www.linkedin.com/in/mtomlins/ - Paul McLean - предоставляет API для тестовых данных, https://www.youtube.com/watch?v=bFAICy5j35M https://www.linkedin.com/in/paulmclean2/ интересные материалы, тестирование производительности Starlink и геораспределенное тестирование с помощью Gatling, тренды тестирования приоизводительности в 2021 году https://www.youtube.com/watch?v=z3yvh4syuqw и https://www.mammoth-ai.com/top-performance-engineering-trends-5-things-your-team-needs-to-know/ - Joe Calantonio, Performance & SRE Podcast https://testguild.com/podcasts/performance/ и https://www.linkedin.com/in/joecolantonio/ - Andreas Grabner https://www.linkedin.com/in/grabnerandi/ OpenTelemetry, Keptn - Federico Toledo, jmeter-java-dsl https://www.linkedin.com/in/federicotoledo/ - Vitaly Friedman, https://www.linkedin.com/in/vitalyfriedman/, - Alex Xu, https://www.linkedin.com/in/alexxubyte/ System Design - 🤠Leandro Melendez (Señor Performo) https://www.linkedin.com/in/leandromelendez/ интервью с разными инженерами - Henrik Rexed https://www.linkedin.com/in/hrexed/ Observability, Dynatrace, OpenTelemetry, eBPF - Jason Arbon, test.ai, https://www.linkedin.com/in/jasonarbon/ Batch вставка результатов тестов, после выполнения всех тестов это быстрее, чем вставка результатов тестов после каждого теста - Mehdi Daoudi, Cachpoint https://www.linkedin.com/in/mdaoudi/ - Kent Beck, - Stephen Townshend, https://www.linkedin.com/in/stephentownshend/ - Jeff Barr, - Delvis Echeverria, https://www.linkedin.com/in/delvisecheverria/recent-activity/ - Denis Bakhvalov, https://www.linkedin.com/in/dendibakh/ -

Что нового в нагрузке

для меня в 2022 году?

Смирнов Вячеслав, Miro

Ускоряю Miro

Развиваю @qa_load

Изучаю языки и технологии

2007, 2018, 2022 : хакер,тимлид,инженер

Что нового в нагрузке сделал я?

Что нового в нагрузке сделали другие?

Что нового в нагрузке сделал я?

Цель — создать сообщество performance-инженеров в компании

Собираем вещи, есть работа

Другой язык, AWS и облака, тестирование в облаках

Развитие коммуникативных навыков, английский язык и тесты в облаках важны

Тестирование обновления и масштабирования кластера

Hazelcast, JUnit, Jenkins, Prometheus, Grafana

Старая версия системы работает, пусть 100 узлов

Новая версия запускается (с запасом), пусть + 120 узлов

Старая версия системы останавливается, в итоге 120 узлов

Быстрый рост на 120-150% и быстрый спад

Что нужно протестировать?

Быстрый рост кластера распределенных кешей

Быстрый спад кластера распределенных кешей

Быстрый рост пула подключений к базе данных

...

Как быстро можно запускать и останавливать?

На каком размере кластера можно обновляться?

Малый кластер успевает синхронизироваться

Большой кластер не успевает синхронизироваться

Большой кластер не успевает синхронизироваться

Делать сложную задачу на стыке Test и Ops можно простыми инструментами

Выявление медленных и частых SQL-запросов

Grafana, ElasticSearch, OpenSearch

Пример структурированного лога

По части полей точно можно фильтровать и группировать

А часть полей слишком уникальные

Добавим в Grafana названия полей как переменную-список

Сделаем Repeat-панели с таблицей и графиком по списку

По каждому значению можно отфильтровать в один клик

Grafana и repeat-панели позволяют быстро находить узкие места по логам

Составить профиль нагрузки

Jaeger, Kibana, ElasticSearch, OpenSearch

Применение Jaeger и OpenTracing для анализа профиля нагрузки в Kibana

Растиражировать тесты по командам и увеличить покрытие профиля нагрузки

k6

Переход к простым тестам, вместо сложных на 100 ручек

auth — результат аутентификации, data — статистика

Меняется одна функция и конфиг при тиражировании

Переход к простым тестам на узкое место, на проблему

Написать регрессионные нагрузочные тесты-метрики backend'а, как замена Jaeger

k6, VictoriaMetrics, Prometheus, InfluxDB, Grafana

Давать метрики командам, важнее, чем отчет и баги по производительности

Запускать тесты с разными профилями на разных стендах, с разных агентов и локально

docker, docker-compose

Параметризация тестовых данных, стенда и профиля

Для Taurus надо будет получить ENV с профилем скриптом

В Docker можно монтировать и каталог и файл в каталоге

Запуск тестов из Docker удобен и перспективен

Автоматизация нагрузки по расписанию или кнопке

Jenkins, Pipeline, Python, Ansible, Terraform

Работа со стендом и метриками наиболее сложны

Облачный тестовый стенд автоматически создается для тестирования

Написать регрессионные нагрузочные тесты-метрики frontend'а, как замена Jaeger

sitespeed.io

Потрясающие отчеты

Просто потрясающие отчеты

А если нужна аутентификация?

В конфиге теста настроим использование user-data-dir

Сначала сделаем аутентификацию в папку user-data-dir

А потом тесты с той же папкой user-data-dir

Тесты фронта с sitespeed.io делаются просто, приносят массу пользы

Что нового в нагрузке сделали другие?

Андрей Похилько, UP9, быстрый mock server, Mockintosh

UP9, сетевой отладчик k8s, Mizu

Андрей Сатарин, исследование сбоев при обновлениях

Mark Tomlinson, Performance Exploration For Testers

Андрей Акиньшин, Профессиональный бенчмарк

Будущее будет быстрым