
Компанія IBM випустила оновлену версію своєї провідної платформи для візуального моделювання та аналізу даних – IBM SPSS Modeler 18.6. Нова версія пропонує бізнес-користувачам розширені можливості для роботи з даними, покращену продуктивність та глибшу інтеграцію з сучасними екосистемами даних. Основний акцент у релізі зроблено на підвищенні ефективності аналітичних процесів, розширенні функціоналу для роботи з різними джерелами даних та наданні більш гнучких інструментів для аналітиків та науковців, що працюють з даними.
Цей випуск зміцнює позиції SPSS Modeler як потужного інструменту для побудови прогнозних моделей без необхідності глибокого програмування, одночасно розширюючи можливості для досвідчених користувачів, які працюють з R та Python. Нові функції спрямовані на вирішення ключових завдань, з якими стикаються компанії у процесі перетворення сирих даних на цінні бізнес-інсайти.
Інтеграція з IBM watsonx.data: Прямий доступ до озера даних
Одним з ключових оновлень в IBM SPSS Modeler 18.6 є нативна інтеграція з платформою зберігання даних нового покоління – IBM watsonx.data. Ця інтеграція реалізована через високопродуктивний запитовий двигун PrestoSQL, що відкриває для бізнес-користувачів нові горизонти в аналізі великих масивів даних.
Раніше для аналізу даних, що зберігаються в хмарних або гібридних середовищах, часто була потрібна їх попередня екстракція, трансформація та завантаження (ETL), що забирало час та ресурси. Завдяки новій інтеграції, користувачі SPSS Modeler можуть виконувати запити безпосередньо до даних, що зберігаються в watsonx.data, використовуючи переваги технології SQL pushback.
Це означає, що значна частина обчислень, пов’язаних з обробкою та агрегацією даних, переноситься на сторону джерела даних. Замість того, щоб переміщувати величезні обсяги даних до Modeler для обробки, платформа “проштовхує” SQL-запити до watsonx.data, де вони виконуються за допомогою оптимізованого двигуна Presto. Такий підхід має низку суттєвих переваг для бізнесу:
- Підвищення продуктивності: Аналіз великих наборів даних відбувається значно швидше, оскільки мінімізується час на передачу даних. Це дозволяє аналітикам швидше отримувати результати та приймати рішення на їх основі.
- Зниження навантаження на мережу: Зменшення обсягів переданих даних звільняє мережеві ресурси компанії для інших завдань.
- Актуальність даних: Аналітики працюють з найсвіжішими даними, що знаходяться в озері даних, без необхідності чекати на завершення процесів реплікації чи ETL.
- Оптимізація витрат: Ефективне використання ресурсів джерела даних може призвести до зниження загальних витрат на інфраструктуру для аналітики.
Для бізнес-користувача це означає можливість будувати складні моделі на основі даних з усього підприємства в єдиному середовищі, не турбуючись про технічні складнощі, пов’язані з доступом до даних.
Розширені можливості для роботи з R та Python
IBM SPSS Modeler 18.6 продовжує слідувати тренду на інтеграцію з інструментами з відкритим вихідним кодом, надаючи аналітикам та науковцям з даних ще більше гнучкості. Нова версія підтримує останні стабільні версії мов програмування, що є стандартом в галузі аналізу даних:
- Підтримка R 4.4.0: Дозволяє користувачам використовувати найновіші пакети та бібліотеки, розроблені спільнотою R, для вирішення специфічних аналітичних завдань. Це означає доступ до передових алгоритмів та методів візуалізації безпосередньо в середовищі Modeler.
- Підтримка Python 3.10.7: Забезпечує сумісність з сучасними бібліотеками для машинного навчання (наприклад, scikit-learn, TensorFlow, PyTorch) та обробки даних (pandas, NumPy).
Ця розширена підтримка дозволяє створювати гібридні процеси, в яких візуальне моделювання в IBM SPSS Modeler поєднується з потужністю та гнучкістю R та Python. Бізнес-аналітики можуть використовувати звичний drag-and-drop інтерфейс для більшості завдань з підготовки даних та моделювання, а для специфічних завдань (наприклад, використання унікального алгоритму або складної трансформації даних) – інтегрувати вузли з кодом на R або Python.
Такий підхід демократизує аналітику в компанії: бізнес-користувачі можуть самостійно будувати моделі, а науковці з даних – розширювати їх можливості за допомогою коду, працюючи в єдиному collaborative середовищі.
Підвищення продуктивності та оновлення платформи
На додаток до основних функціональних оновлень, в IBM SPSS Modeler 18.6 було внесено низку важливих технічних покращень, спрямованих на підвищення стабільності та продуктивності платформи.
- Покращена продуктивність для Azure Synapse Analytics: Аналогічно до інтеграції з watsonx.data, було оптимізовано роботу з хмарним сховищем даних від Microsoft. Завдяки покращеній підтримці SQL pushback, користувачі, що працюють з даними в Azure Synapse, відчують значне прискорення виконання запитів та побудови моделей.
- Оновлення середовища виконання Java: Платформа тепер працює на базі IBM Semeru JRE 17, що забезпечує підвищену безпеку, стабільність та продуктивність роботи додатку.
- Підтримка нових операційних систем: Додано офіційну підтримку Ubuntu 24 та Red Hat Enterprise Linux (RHEL) 9.4, що надає компаніям більше гнучкості у виборі інфраструктури для розгортання SPSS Modeler Server.
Ці, на перший погляд, технічні деталі, мають прямий вплив на бізнес-процеси. Підвищення продуктивності скорочує час очікування результатів, а підтримка сучасних операційних систем гарантує сумісність та безпеку в довгостроковій перспективі.
Відновлення підтримки текстової аналітики для японської мови
У версії 18.6 IBM відновила повноцінну підтримку текстової аналітики для японської мови. Це стратегічно важливе оновлення для компаній, що працюють на японському ринку або аналізують дані, отримані від японських клієнтів, партнерів чи з японських джерел.
Модуль Text Analytics в SPSS Modeler є потужним інструментом для видобування цінних інсайтів з неструктурованих текстових даних, таких як відгуки клієнтів, повідомлення в соціальних мережах, записи кол-центрів, електронні листи та відкриті відповіді в опитуваннях. Складність японської мови, з її ієрогліфічною писемністю та відсутністю чітких пробілів між словами, робить її аналіз особливо складним завданням для стандартних алгоритмів.
Оновлений функціонал пропонує лінгвістичні ресурси та алгоритми, спеціально адаптовані для японської мови, що дозволяє бізнесу:
- Аналізувати тональність (Sentiment Analysis): Автоматично визначати емоційне забарвлення текстів (позитивне, негативне, нейтральне), що є критично важливим для моніторингу репутації бренду, оцінки задоволеності клієнтів та аналізу ефективності маркетингових кампаній.
- Видобувати ключові теми та поняття: Розуміти, про що говорять клієнти, виявляти основні проблеми, з якими вони стикаються, та знаходити нові ідеї для розвитку продуктів та послуг.
- Класифікувати звернення: Автоматично розподіляти вхідні звернення за категоріями (наприклад, скарги, запити на інформацію, пропозиції), що дозволяє оптимізувати роботу служби підтримки та прискорити час реакції.
Для компаній, що прагнуть глибше зрозуміти японський ринок, це оновлення відкриває можливість перетворювати величезні масиви текстової інформації на структуровані дані, які можна використовувати для побудови точних прогнозних моделей та прийняття обґрунтованих бізнес-рішень.
Висновок
Випуск IBM SPSS Modeler 18.6 є логічним кроком у розвитку платформи, спрямованим на задоволення потреб сучасного бізнесу, що працює в умовах гібридних та мультихмарних середовищ. Поглиблена інтеграція з ключовими платформами даних, такими як IBM watsonx.data та Azure Synapse, відновлення важливого функціоналу для аналізу текстових даних та розширення підтримки інструментів з відкритим вихідним кодом роблять Modeler ще більш потужним та універсальним інструментом. Нова версія дозволяє компаніям не тільки прискорити процеси аналізу даних, але й підвищити якість бізнес-рішень, що приймаються на їх основі. Таким чином, оновлення до версії IBM SPSS Modeler 18.6 стає стратегічною інвестицією в аналітичну зрілість та конкурентоспроможність компанії на ринку, що швидко змінюється.