Блог о PostgreSQL от Аристова Евгения

  • Транзакции и MVCC в PostgreSQL

    Статья основана на материалах открытого вебинара “Особенности MVCC PostgreSQL”. Запись занятия доступна как в ютуб версии, так и на рутуб канале и VK Видео. Презентация и исходники доступны по ссылке. MVCC (Multi-Version Concurrency Control) – это механизм управления параллельным доступом к данным в базе данных, который широко используется в PostgreSQL и других СУБД для поддержки одновременных транзакций…

  • Ответ на сount(1) или count(*) в PostgreSQL

    Холиварный вопрос – что же лучше? На самом деле ответ лежит намного глубже. Давайте исследовать. Зальем мою БД по Тайским перевозкам на ~6 млн записей. Загрузим её в наш инстанс PostgreSQL командой: wget https://storage.googleapis.com/thaibus/thai_small.tar.gz && tar -xf thai_small.tar.gz && psql < thai.sql Получили БД объемом 600 Мб – посмотреть можно используя команду \l+ в psql,…

  • Транзакции в PostgreSQL

    Реляционная теория и SQL позволяет абстрагироваться от конкретной реализации СУБД, но есть одна непростая проблема: как обеспечить параллельную работу множества сессий (concurrency), которые модифицируют данные, так, чтобы они не мешали друг другу ни с точки зрения чтения, ни с точки зрения записи и обеспечивали целостность данных (consistency) и их надежность (durability)? Ответ – транзакционные системы…

  • Использование DML (Data Manipulation Language) в PostgreSQL

    Одной из важнейших функций PostgreSQL является возможность выполнения операций манипуляции данными (DML), которые позволяют добавлять, изменять и удалять данные в таблицах. В этой статье мы рассмотрим основы использования DML в PostgreSQL и покажем примеры различных операций. Что такое DML? DML (Data Manipulation Language) – это часть языка SQL, которая позволяет осуществлять манипуляцию данными в базе…

  • Базовые настройки PostgreSQL

    После установки инстанс PostgreSQL в целом НЕ настроен и это может отрицательно отразиться на производительности. Несмотря на то, что настроек в PostgreSQL более 350, можно выделить основные: shared_buffers Используется для кэширования данных. По умолчанию низкое значение (для поддержки как можно большего кол-ва ОС). Начать стоит с его изменения. Согласно документации, рекомендуемое значение для данного параметра…

  • Структура БД (DDL) в PostgreSQL

    В предыдущей статье мы рассмотрели логическую структуру PostgreSQL и видели, что основным контейнером верхнего уровня является База Данных, далее идет схема и в ней уже создаются другие объекты. Схемой по умолчанию является схема public. Именно в ней и создаются по умолчанию все объекты. Хорошей практикой является использовать свои схемы, а на public отобрать права у…