Архив рубрики: Greenplum

Как правильно работать с Greenplum. Часть третья — «distributed by»

distributed-byПродолжаем рассматривать Greenplum со всех сторон.

Основным механизмом работы с таблицами в Greenplum является их правильное создание — а именно, использование правильного условия distributed by. Правильное определение полей, по которым нужно «размывать» данные по узлам — гарантия высокопроизводительной работы системы. Читать далее

Как правильно работать с Greenplum. Часть вторая — gpfdist

gpfdistИтак, рассмотрев в прошлом обзоре заблуждения, перейдем к способам эффективной работы с Greenplum.
Основным инструментом для загрузки данных в Greenplum и выгрузке данных из Greenplum является утилита gpfdist. Это по сути http-сервер, с которым Greenplum разговаривает сразу всеми своими узлами, достигая большой скорости как загрузки, так и выгрузки данных.

Читать далее

Как правильно работать с Greenplum. Часть первая — о заблуждениях

Greenplum-how

В этой статье Михаил Герштейн делится своим опытом работы с аппаратно-программным комплексом Greenplum. Представляем вашему вниманию первую часть статьи. Читать далее