Основные принципы работы с узлами

Узлы представляют собой основные конструктивные элементы аналитического проекта, которые пользователь добавляет на скрипт, чтобы дать команду PolyAnalyst выполнить определенные операции по обработке данных.

Узел обозначает отдельное действие по обработке данных, например, импорт данных или создание статистической модели. После того, как узел выполнил свою функцию, он также будет обозначать результаты выполненной операции, например, импортированную таблицу данных или статистическую модель.

Разговаривая на языке PolyAnalyst

Узлы в PolyAnalyst могут быть использованы и по отдельности, однако главное их преимущество состоит в том, что они могут объединяться в цепочки для решения крупных аналитических задач. Объединение узлов в цепочки позволяет выполнять целую серию аналитических операций. Выходные данные одного узла становятся исходными данными другого узла, и так далее.

Например, вы можете создать очень простую цепочку из двух узлов, первый из которых импортирует данные, а второй выполняет с ними какую-либо аналитическую операцию.

Образно говоря, составление цепочки узлов в PolyAnalyst можно сравнить с процессом построения предложения. Узлы похожи на отдельные слова в предложении. Предложение сообщает некоторую общую мысль. В этом смысле, изучение принципов работы системы PolyAnalyst похоже на изучение иностранного языка. Выражение ваших аналитических задач в PolyAnalyst можно рассматривать как процесс перевода. Изучение этого иностранного языка подразумевает изучение лексики (узлов), изучение значения каждого слова (назначение каждого узла) и изучение того, как составлять предложения, используя доступные слова для выражения своей мысли (достижение некоторого аналитического результата).

Узлы в PolyAnalyst существенно отличаются друг от друга по уровню сложности. Умение разговаривать на языке PolyAnalyst свободно потребует определенного времени. Начинать лучше всего с понимания нескольких ключевых глаголов, таких как "импортировать", "фильтровать", "добавлять" и "анализировать". Для начала работы вам не нужно изучать абсолютно все узлы.

Обзор основных операций с узлами

Как правило, использование узлов сводится к следующим шагам, каждый из которых в дальнейшем будет рассмотрен более подробно.

  1. Выберите узел из палитры узлов PolyAnalyst и добавьте его в текущий открытый проект.

  2. Соедините узел с другими узлами.

  3. Настройте узел.

  4. Выполните узел.

  5. Ознакомьтесь с результатами узла.

Ввод - действие - результат

Любой узел в PolyAnalyst принимает данные на входе, выполняет какое-то действие, и выдает преобразованные данные на выходе.

Например, рассмотрим узел, импортирующий данные из базы данных в PolyAnalyst:

  • Исходные данные узла хранятся в базе данных.

  • Действие узла - процесс импорта данных.

  • Выходные данные узла - импортированные данные.

Теперь рассмотрим узел, удаляющий отдельные колонки из таблицы:

  • Входные данные узла - таблица данных, которая, возможно, создана другим узлом.

  • Действие узла - удаление определенных колонок из таблицы данных.

  • Выходные данные узла - измененная таблица данных.

Рассмотрим узел, который добавляет новую колонку в таблицу данных:

  • Входные данные узла - таблица данных, которая, возможно, создана другим узлом.

  • Действие узла - добавление колонки во входную таблицу данных.

  • Выходные данные узла - измененная таблица данных, которая по сути является исходной таблицей, содержащей дополнительную колонку.

Наконец, рассмотрим узел, который обучает модель:

  • Входные данные узла - обучающая таблица данных.

  • Действие узла - создание статистической модели.

  • Выходные данные узла - модель.

Узел - одновременно и операция, и ее результат. Узел, импортирующий данные, - это и операция импорта, и импортированные данные.

До того момента, как узел будет выполнен, он представляет собой лишь операцию; после выполнения это еще и результат.

Результат аналитического проекта может состоять из результатов отдельных узлов. Например, это может быть серия таблиц, несколько моделей и графиков, а также несколько отчетов. Эта коллекция результатов и составляет конечный продукт анализа, некий конечный пункт отчетности.

Настройка узлов

Для того, чтобы выполнить узел, т.е. использовать его аналитический потенциал для решения конкретной задачи, недостаточно просто добавить узел на скрипт.

Например, когда вы добавите в проект узел, импортирующий файл с данными, узел не будет знать, какой именно файл ему необходимо импортировать.

На самом деле, вы можете добавить на скрипт любое количество узлов, не указав их конкретную задачу в проекте. Такие узлы не требуют много ресурсов, единственной проблемой при таком подходе может оказаться запутанный, загроможденный скрипт. Тем не менее, на начальном этапе работы это вполне приемлемо, поскольку вы только учитесь использовать узлы; вы можете пробовать разные комбинации узлов с разными задачами, удалять их и др.

Для того, чтобы выполнить узел, т.е., чтобы дать ему команду выполнить конкретную задачу, необходимо выполнить настройку узла.

Например, чтобы использовать узел, импортирующий электронную таблицу, вам нужно:

  1. Добавить узел импорта электронных таблиц в ваш проект.

  2. Выбрать файл с электронной таблицей для импорта путем настройки свойств данного узла.

  3. Дать узлу команду выполнить конкретную задачу (в данном случае это импорт электронной таблицы).

Операция, выполняемая узлом, называется выполнением узла. Когда пользователь дает команду PolyAnalyst на выполнение специфической для узла операции, он выполняет узел.

После импорта таблица данных (содержимое импортированной электронной таблицы) становится выходными данными узла. Эти выходные данные затем могут быть использованы другими узлами в качестве исходных данных.