Как определить что товары относятся к одной модели
Модели товаров
Модель — это товар, описание которого хранится на Яндекс.Маркете.
Для каждой модели создается карточка модели — страница с набором параметров и характеристик товара, сгруппированных в логические блоки.
В Яндекс.Маркете существуют следующие виды моделей:
Родительские (групповые) — модель соответствует товару с дочерними моделями (модификациями).
В некоторых параметрах модели содержатся сразу несколько значений, которые могут быть уточнены пользователем при поиске с помощью фильтров на странице карточки модели. Например, модель шины может содержать все возможные значения диаметров для данной модели.
Визуальные — каждая модель соответствует одному уникальному товару. Карточка такой модели содержит большое количество изображений товара увеличенного формата.
Следующие ресурсы предоставляют возможность получать информацию о моделях на Яндекс.Маркете:
Информация о модели
Возвращает информацию об указанной модели.
Список обзоров на модель
Возвращает список обзоров на указанную модель
Поиск модели по названию и параметрам
Возвращает информацию о модели по названию и дополнительным параметрам, удовлетворяющим заданным в запросе условиям поиска.
Список популярных моделей
Возвращает список популярных моделей категории.
Список предложений на модель
Возвращает список предложений, соотнесенных с указанной моделью.
Список фильтров для предложений на модель
Возвращает список фильтров, доступных для фильтрации предложений на указанную модель.
7.2. Определение однородности товаров и/или услуг
Положения законодательства, не допускающие регистрацию на имя разных лиц в отношении однородных товаров тождественных или сходных до степени смешения товарных знаков, призваны защищать интересы как правообладателя исключительного права на товарный знак, так и потребителя, не допуская возможности обозначения однородных товаров разных изготовителей тождественными или сходными до степени смешения товарными знаками, что привело бы к дезориентации потребителя.
Установление тождества товарных знаков или их сходства до степени смешения проводится при экспертизе заявок на товарные знаки в отношении однородных товаров и услуг.
Применительно к рассмотрению вопросов о регистрации и использовании тождественных или сходных до степени смешения товарных знаков под однородными товарами также следует понимать товары, в отношении которых у потребителя может создаваться представление о происхождении этих товаров из одного и того же предприятия или из экономически связанных предприятий.
7.2.1. Критерии однородности товаров и/или услуг
При установлении однородности товаров определяется принципиальная возможность возникновения у потребителя представления о принадлежности этих товаров одному изготовителю.
Для установления однородности товаров могут приниматься во внимание такие обстоятельства как, в частности, род (вид) товаров, их потребительские свойства и функциональное назначение (объем и цель применения), вид материала, из которого они изготовлены, взаимодополняемость либо взаимозаменяемость товаров, условия их реализации (в том числе общее место продажи, продажа через розничную либо оптовую сеть), круг потребителей, традиционный или преимущественный уклад использования товаров и другие признаки. Вывод об однородности товаров делается по результатам анализа по перечисленным признакам в их совокупности в том случае, если товары по причине их природы или назначения могут быть отнесены потребителями к одному и тому же источнику происхождения.
Принятая МКТУ не влияет на оценку однородности товаров и услуг.
Признаки однородности товаров подразделяются на основные и вспомогательные.
К основным признакам относятся:
Остальные признаки относятся к вспомогательным.
Основные признаки однородности товаров могут учитываться как каждый в отдельности, так и в совокупности один с другим и со вспомогательными признаками. При этом основные признаки могут переходить в разряд вспомогательных.
7.2.1.1. Основные признаки однородности
Род и вид товаров (услуг)
Чаще всего основанием для признания товаров однородными является их принадлежность к одной и той же родовой или видовой группе.
Например, однородными товарами являются следующие товары 25 класса МКТУ: «платье, блузки, юбки, жакеты, брюки, пиджаки», так как все эти товары относятся к одной родовой группе «одежда».
Однако неоднородными товарами могут быть признаны товары 25 класса МКТУ «одежда» и товары 9 класса МКТУ «одежда для защиты от огня», также относящиеся к одной родовой группе, но имеющие разное назначение.
Вид товара и/или услуги – это главные свойства или характеристики, по которым узнается этот товар и/или услуга. Вид обычно соответствует определенному типу, сорту или категории товаров и/или услуг.
Тот факт, что сравниваемые товары и/или услуги подпадают под одно и то же родовое понятие в классе или термин широкой категории, не означает автоматически, что они относятся к одному и тому же виду. Например, широкой является категория «продукты питания для потребления человеком». Мясо, рыба, птица и дичь являются продуктами питания животного происхождения. Фрукты и овощи – это продукты питания растительного происхождения. Эта связь между ними, т.е. принадлежность к продуктам питания, не исключает того, что они относятся к разным видам товаров.
Товары, относящиеся к одному роду, могут быть признаны неоднородными. Так, например, товары 25 класса МКТУ «одежда» и товары 9 класса МКТУ «одежда для защиты от огня» относятся к одной родовой группе, но имеют разное назначение.
Неоднородными товарами могут быть признаны «соковыжималки бытовые электрические» (7 класс МКТУ) и «соковыжималки бытовые неэлектрические» (21 класс МКТУ), хотя они и относятся к одному виду товаров, но все же имеют ряд существенных различий. Соковыжималка бытовая электрическая представляет собой сложный трудоемкий прибор. Она продается в специализированных магазинах бытовой техники или в соответствующих секциях универмагов, торговых центров. В то же время соковыжималка бытовая неэлектрическая – это более простое устройство. Она продается чаще всего в хозяйственных магазинах (в хозяйственных торговых секциях) наряду с другой мелкой кухонной утварью. Кроме того, оба товара имеют разную стоимость. Электрическая соковыжималка является более дорогостоящим товаром, чем неэлектрическая.
При определении однородности услуг также может быть учтена их принадлежность к одному и тому же роду, виду.
Например, по этому признаку могут рассматриваться в качестве однородных такие услуги как «продвижение товаров (для третьих лиц)» и «реклама». Продвижение товаров – это совокупность разных мер, усилий, действий, предпринимаемых в целях повышения спроса на товары, увеличения их сбыта, расширения рыночного поля товаров. Реклама является одним из средств продвижения товаров. В связи с этим она может быть отнесена к совокупности услуг, оказываемых при продвижении товаров.
Назначение товаров (услуг)
При определении однородности товаров с учетом их назначения целесообразно принимать во внимание область применения товаров и цель применения.
Например, могут быть признаны однородными товарами «препараты химические для защиты злаков от головни», относящиеся к 1 классу МКТУ, и «препараты химические для обработки злаков, пораженных головней», относящиеся к 5 классу МКТУ. Данные товары имеют одинаковую область применения (сельское хозяйство) и относятся к общей родовой группе (химические препараты). Кроме того, эти товары предназначены для обработки одинакового семейства растений (злаков) с целью борьбы с одним и тем же заболеванием (головней, вызываемой грибами-паразитами).
В то же время не могут быть признаны однородным товарами «машины для прополки», относящиеся к 7 классу МКТУ, и «культиваторы, полольники, сапки для прополки крупных сорняков», относящиеся к 8 классу МКТУ. Эти товары, хотя и имеют одно и то же назначение, поскольку применяются в сельском хозяйстве с целью прополки сорняков, но относятся к разным родовым группам (машины и ручные инструменты), а также отличаются по своей стоимости и условиям сбыта.
К однородным товарам могут быть отнесены «мыла дезинфицирующие» (3 класс МКТУ) и «средства дезинфицирующие для гигиенических целей» (5 класс МКТУ), так как они имеют одинаковую цель применения (дезинфекция – уничтожение возбудителей инфекционных и паразитарных болезней) и могут относиться к одной и той же родовой группе (химические товары).
Однако «аппараты для дезинфекции» (11 класс МКТУ) не могут быть признаны однородными с указанными выше товарами, поскольку они относятся к другой родовой группе (приборы, технические устройства).
Область применения товара может сужать его функциональное назначение. Например, общее функциональное назначение такого товара, как «перчатки» – защита рук. В то же время в МКТУ присутствуют товары «перчатки для водолазов» (9 класс МКТУ), «перчатки для медицинских целей» (10 класс МКТУ), «перчатки для домашнего хозяйства» (21 класс МКТУ), «перчатки – аксессуары для игр (бокса, бейсбола, гольфа и т.д.)» (28 класс МКТУ). Все вышеперечисленные товары имеют свои особенности в силу различий их использования и могут быть отнесены к неоднородным товарам.
При установлении однородности услуг целесообразно руководствоваться, в первую очередь, назначением услуги, если услуга предназначена для конкретного вида деятельности (реклама, страхование, воспитание и т.д.).
Услуги, относящиеся к одному виду, но оказываемые в разных областях деятельности, не могут быть отнесены к однородным.
Например, не могут рассматриваться однородными между собой услуги «информация по вопросам страхования» (36 класс), «информация по вопросам строительства» (37 класс), «информация по вопросам перевозок» (39 класс), «информация по вопросам воспитания и образования» (41 класс), «информация метеорологическая» (42 класс).
Вид материала, из которого изготовлены товары
Однородными могут быть признаны товары, хотя и относящиеся к разному роду (виду), но изготовленные из одного и того же вида материала.
Например, можно считать однородными такие товары 14 класса МКТУ, как «статуэтки из благородных металлов» и «коробки из благородных металлов», несмотря на принадлежность их к разным видам товаров. Данные товары изготавливаются из одинакового материала – благородного металла. Этот материал является очень дорогим и редко применяется в производстве товаров. Поэтому оба вида товаров обладают высокой стоимостью. Кроме того, они реализуются одинаковым образом (в ювелирных магазинах и секциях).
В качестве еще одного примера, иллюстрирующего значение материала, из которого изготовлены товары, при определении их однородности, можно привести товары «ящики из обычных металлов» (6 класс МКТУ) и «ящики деревянные» (20 класс МКТУ).
Несмотря на то что данные товары относятся к одному виду, они не являются однородными. Использование разного материала в этом случае влияет на стоимость товаров, их свойства и назначение. Обычный металл, в отличие от дерева, увеличивает стоимость товара, делает его более долговечным, придает ему определенные свойства (например, прочность, огнестойкость). Вследствие этого металлические ящики могут, в частности, применяться для транспортировки и хранения ценных предметов.
7.2.1.2. Вспомогательные признаки однородности
Приведем примеры учета некоторых вспомогательных признаков при установлении однородности товаров (услуг).
Одним из вспомогательных признаков однородности товаров являются условия их реализации. Например, краскам, олифам, лакам могут сопутствовать в торговле препараты для чистки, полирования, обезжиривания и абразивной обработки. В связи с этим могут быть признаны однородными «лаки» (2 класс МКТУ) и «пасты для полирования» (3 класс МКТУ).
В рамках рассматриваемого признака целесообразно также учитывать каналы реализации изделий. Для изделий, реализуемых через розничную сеть, вероятность смешения выше, чем для изделий, которые распространяются оптом в соответствии с заключенными договорами.
В зависимости от круга потребителей товары могут быть разделены на две группы: товары широкого потребления и товары производственно-технического назначения.
Так, например, товары «контейнеры для контактных линз» и «хирургические аппараты и инструменты», относящиеся к 10 классу МКТУ, различны по кругу потребителей. В первом случае круг потребителей широкий, во втором – специалисты в области медицины.
В отношении товаров широкого потребления, таких как косметические и гигиенические изделия, продукты питания, домашняя утварь, одежда, обувь, вино-водочные, табачные изделия и т.п., при оценке однородности товаров целесообразно применять более строгий подход, чем в отношении товаров производственно-технического назначения. Потребители товаров широкого потребления приобретают данные товары, как правило, от случая к случаю. Поэтому вероятность смешения в данной ситуации является более высокой.
В отношении товаров производственно-технического назначения вероятность смешения может быть меньшей, так как эти товары предназначены для ограниченного круга потребителей, включающего специалистов, которым обычно известны изготовители продукции в соответствующей отрасли. К товарам производственно-технического назначения относятся промышленное оборудование, приборы, сырьевые материалы и т.п.
Длительность использования и стоимость товаров
При определении однородности товаров целесообразно учитывать, предназначены ли товары для длительного пользования или краткосрочного, а также какой стоимостью они обладают (например, дорогостоящие или дешевые). При покупке изделий длительного пользования или дорогостоящих (например, автомобилей, холодильников, компьютеров, мебели, ювелирных изделий и т.д.) покупатели бывают особенно внимательны, и вероятность смешения в данном случае невелика.
Наоборот, в отношении товаров краткосрочного пользования или дешевых степень внимательности покупателей снижается, и вероятность смешения соответственно увеличивается. К таким товарам могут быть отнесены продукты питания, напитки, косметические и гигиенические изделия, периодические печатные издания, канцелярские товары и т.д.
7.2.2. Взаимосвязи между разными признаками
Критерии однородности взаимосвязаны. Следует отметить, что довольно часто наблюдаются зависимость признаков, т.е. если имеется совпадение по одному признаку, то оно также будет присутствовать и по другому признаку.
Целесообразно рассматривать все признаки в совокупности в каждом конкретном случае. Окончательный вывод о наличии однородности можно сделать, сопоставив все признаки.
7.2.3. Однородность товаров и/или услуг и сходство обозначений
Степень однородности товаров и/или услуг тесно связана со степенью сходства обозначений, предназначенных для их маркировки.
В ситуации, когда заявленное обозначение и противопоставленный товарный знак (обозначение) являются тождественными или незначительно отличаются друг от друга, т.е. почти тождественны, однородными могут быть признаны товары и связанные с этими товарами услуги.
Например, в этом случае однородными могут быть признаны товары «автомобили» (12 класс) и услуги «ремонт и техническое обслуживание автомобилей» (37 класс).
При наличии противопоставленного товарного знака или блока противопоставленных товарных знаков одного и того же правообладателя, зарегистрированных для широкого и разнообразного диапазона товаров (как в пределах разных классов МКТУ, так и в пределах одного класса МКТУ), может быть расширен круг товаров, рассматриваемых как однородные.
Например, обозначение заявлено для следующего перечня товаров 9 класса МКТУ: «автоматы торговые; аппараты кассовые». Противопоставленный товарный знак зарегистрирован для следующего перечня товаров 9 класса МКТУ: «аппараты для передачи звука, проекционные, телеграфные, телефонные, факсимильные; приборы и инструменты астрономические, геодезические, для взвешивания, навигационные, оптические, физические, химические; приборы измерительные, метеорологические; компьютеры, принтеры, модемы; телевизоры; устройства и оборудование спасательные».
Правообладателю противопоставленного товарного знака принадлежит исключительное право его использования в отношении множества разных групп товаров. В рассматриваемой ситуации в результате применения тождественных знаков или знаков с высоким уровнем сходства разными изготовителями для перечисленных выше заявленных и противопоставленных товаров у потребителя может возникнуть представление о принадлежности этих товаров одному изготовителю. Следовательно, эти товары могут рассматриваться как однородные.
В качестве другого примера может быть рассмотрена следующая схожая ситуация.
Обозначение заявлено для товаров 21 класса МКТУ «щетки обувные, губки для придания блеска обуви» и товаров 26 класса МКТУ «шнурки для обуви». При экспертизе заявленного обозначения установлено, что оно сходно до степени смешения с тремя товарными знаками, принадлежащими одному правообладателю. Противопоставленные товарные знаки зарегистрированы для товаров разных классов МКТУ, а именно:
В этой ситуации также указанные заявленные товары 21, 26 классов МКТУ могут рассматриваться как однородные перечисленным противопоставленным товарам 3, 18, 25 классов МКТУ.
7.2.4. Применение МКТУ для регистрации знаков
В качестве инструмента для проведения поиска тождественных и сходных обозначений и определения однородности товаров применяется Международная классификация товаров и услуг для регистрации знаков.
Сравниваемые товары и услуги разбиты на категории в соответствии с МКТУ.
Действующая на сегодняшний день редакция МКТУ содержит 34 класса (1-34) товаров и 11 классов (35-45) услуг. Каждый класс МКТУ содержит заголовок и сопровождается необходимым пояснением.
В заголовке класса указываются в общем виде области, к которым товары данного класса в принципе могут относиться. Заголовок класса может рассматриваться в качестве краткой характеристики содержания класса (аннотации). В связи с этим заголовок класса не может быть отнесен к эквивалентной замене перечня товаров, содержащихся в данном классе.
В пояснении к классу перечисляются обобщенные названия основных групп товаров, содержащихся в классе. В пояснении также приводятся некоторые конкретные товары, относящиеся или не относящиеся к данному классу.
Информация об актуальной редакции МКТУ и принципах классификации содержится на сайтах ВОИС, Роспатента и ФИПС.
Следует понимать, что факт включения определенных товаров и/или услуг в один и тот же класс МКТУ не значит, что данные товары и/или услуги являются однородными.
Например, относящиеся к 31 классу «живые животные» и «цветы» не однородны.
Также в 35 классе МКТУ «реклама» не соотносится с «психологическим тестированием при подборе персонала».
В 9 классе МКТУ содержатся такие неоднородные товары, как «жилеты спасательные», «коврики для мыши», «огнетушители», «утюги электрические», «фотоаппараты».
Тот факт, что два конкретных товара и/или услуги относятся к одному и тому же классу МКТУ и родовой категории, также не позволяет однозначно считать их однородными. Как правило, признаются неоднородными такие товары, как «автомобили» и «велосипеды», хотя они относятся к родовому понятию «транспортные средства наземные» в 12 классе МКТУ.
В то же время однородные товары могут быть отнесены к разным классам. Например, однородными являются товары «мыла лечебные» (3 класс 030130) и «средства моющие для медицинских целей» (5 класс 050108).
Ниже приводится примерный перечень корреспондирующих классов, в которых могут содержаться однородные товары.
класс МКТУ | корреспондирующие классы |
---|---|
1 | 2, 3, 4, 5, 17, 19 |
2 | 1, 3, 17 |
3 | 1, 2, 5, 21 |
5 | 1, 3, 10, 30, 32 |
6 | 7, 9, 11, 17, 19, 20, 21 |
7 | 6, 9, 11, 12 |
8 | 7, 12 |
9 | 6, 7, 10, 11, 12 |
10 | 5, 9 |
11 | 6, 7, 9, 12 |
12 | 7, 8, 9, 11 |
17 | 1, 2, 6, 19 |
19 | 1, 6, 17 |
20 | 6 |
21 | 6 |
29 | 30, 31 |
30 | 5, 29 |
32 | 5, 33 |
32 | 33 |
Примеры некоторых однородных товаров в корреспондирующих классах:
Услуги в МКТУ преимущественно классифицируются в соответствии с назначением. Как правило, однородные услуги содержатся в пределах одного класса МКТУ. Например, в 43 классе МКТУ к однородным могут быть отнесены услуги «закусочные», «кафе», «кафетерии», «рестораны», «рестораны самообслуживания».
Однако в некоторых случаях, как было указано выше, однородные услуги могут быть приведены в разных классах МКТУ.
МКТУ может служить средством идентификации общих характеристик определенных товаров и услуг. Многие классы МКТУ выделены по принципу функции, назначения или состава, что может быть полезным при сравнении товаров и услуг.
Например, 1 класс МКТУ включает химические продукты, главным образом, на основании их свойств, а не в зависимости от их конкретного применения. В отличие от 1 класса МКТУ, 3 класс МКТУ охватывает все изделия, являющиеся препаратами для стирки и чистки, личной гигиены, парфюмерии и косметики. Хотя эти товары являются химическими продуктами, но относятся к 3 классу из-за своего конкретного назначения.
Следует также отметить, что структура рубрик классов МКТУ имеет существенные различия. Некоторые классы состоят только из одного рода товаров или услуг, под который подпадают все товары или услуги этого класса, и в заголовке класса указано соответствующее родовое понятие (например, 15 класс – «музыкальные инструменты», 38 класс – «телекоммуникации»). Другие классы включают товары или услуги разного рода (например, 9 класс), и в заголовках классов указаны разные родовые понятия, как очень широкие, так и очень узкие (например, в 9 классе указаны широкий термин «приборы и инструменты научные» и узкий термин – «оборудование для тушения огня»).
Иногда как исключение в заголовках классов одновременно содержатся родовые понятия и видовые, например в 5 классе – «перевязочные материалы» и «пластыри». Обычно такое выделение из общего понятия вызвано желанием показать, что этот товар не встретится ни в каком другом классе, хотя он и относится к более широкому понятию данного класса.
Например, в заголовке 1 класса понятие «клеящие вещества для промышленных целей» подпадает под более широкое понятие (родовое) заголовка «химические продукты, предназначенные для использования в промышленных, научных целях». Указание в заголовке 1 класса термина «клеящие вещества для промышленных целей» необходимо для того, чтобы отличить данный товар от клеящих веществ, относящихся к 16 классу, предназначенных для домашнего и офисного использования (для бытовых и канцелярских целей).
Необходимо также учитывать, при каждом пересмотре МКТУ происходят изменения в классификации товаров и услуг (в частности перенос товаров или услуг из одного класса в другой) или изменения в названиях рубрик.
Об информационной модели товара
В современном мире основным источником информации о бытовом товаре для покупателя является интернет, посредством которого можно легко и быстро найти, сравнить, выбрать и даже купить модель товара того или иного типа. Однако мало кто из покупателей задумывается о том, что стоит за формированием контента, на основе которого он этот выбор делает.
Тем не менее, и владелец магазина, и его маркетинговый отдел прекрасно понимают необходимость предоставлять для товаров качественное, исчерпывающее и в то же время достаточно легко воспринимаемое клиентом описание.
Контент о товаре условно можно подразделить на несколько видов:
Информационная модель
В данной статье мы рассмотрим контент третьего типа — техническое описание (на самом деле, на основе этого контента можно получать почти все остальное).
Такой контент, как правило, представляет собой таблицу, состоящую из пар “Атрибут: Значение”. При этом под атрибутом следует понимать некоторое обособленное свойство группы близких по назначению товаров, отражающее их функциональные, физические и/или потребительские качества. Значение атрибута — это реализация такого свойства в данном конкретном товаре (говоря алгебраическим языком, значение есть действие атрибута на товар).
Атрибуты могут быть числовыми, категориальными и текстовыми.
Числовой атрибут представляет собой линейную шкалу, с помощью которой товары можно сравнивать между собой как обычные действительные числа. Как правило, это физическая величина (вес, объем, частота, мощность и т.п.) с единицей измерения (масштабом), либо количественный атрибут (без масштаба). Числовой атрибут в каждом товаре реализуется в виде конкретного числового значения с конкретной единицей измерения. Иногда два числовых атрибута объединяют в один для реализации интервального значения (от и до).
Категориальный атрибут представляет собой конечный список токенов (слов, словосочетаний, наименований, обозначений и т.п.) и в каждом конкретном товаре реализуется некоторым (возможно, пустым) подмножеством данного списка.
Наконец, текстовый атрибут в качестве значений может принимать любой текст из заданного алфавита, т.е. является аналогом категориального атрибута, но с бесконечным множеством возможных значений (звезда Клини в данном алфавите).
При желании все три типа атрибутов можно свести к последнему — текстовому. Для клиента, читающего описание товара, между ними нет никакой разницы. Однако стоит заметить, что чем более структурирован атрибут и чем лучше он оцифрован (пусть даже это будет конечный список векторов или матриц, а не просто число), тем легче его использовать в алгоритмах сравнения товаров и при вычислении их “функции полезности”, а также в фильтрах и тегах. Поэтому техническое описание тем качественнее, чем больше в нем числовых атрибутов и чем меньше (в идеале — совсем нет) текстовых.
Для каждого конкретного товара каждый атрибут в отдельности мало что значит, однако определенный набор атрибутов, реализованный в товаре, уже представляет собой некоторый “генетический код” данного товара, и поэтому от правильности выбора атрибутов зависит то, как данный товар будет соотноситься с другими, родственными товарами, насколько релевантен он будет в поиске, каким способом его можно будет отыскать в множестве подобных товаров.
Отсюда возникает дилемма: какой набор атрибутов, с одной стороны, достаточен для исчерпывающего (делающего его уникальным) описания одного товара, а с другой стороны, сколько вообще нужно атрибутов для того, чтобы адекватно описывать, сопоставлять и сравнивать товары в интернет-магазине или маркет-плейсе.
Как обычно, истина где-то посередине. Все товары необходимо разделить на группы таким образом, чтобы внутри каждой группы было как можно меньше малоиспользуемых атрибутов (крайний вариант: на каждый товар свой набор атрибутов) и в то же время количество этих групп должно быть как можно меньше, а их объем не должен сильно варьироваться от группы к группе (крайний вариант: единый набор атрибутов для всех товаров, т.е. одна группа товаров).
Обычно (и, как правило, эта логика оправдывается) принято подразделять товары на группы в соответствии с их функциями и потребительскими свойствами. Не стоит, например, искать одинаковые наборы атрибутов у микроволновой печи и бензиновой газонокосилки. В то же время, чайники и термопоты вполне могут быть объединены в одну группу товаров с одинаковым набором атрибутов.
Пара (Группа товаров: Набор атрибутов) называется информационной моделью (инфомоделью, моделью).
Таким образом, информационная модель представляет собой многомерное пространство (гиперкуб), измерениями в котором выступают атрибуты, а точками — конкретные физические товары, а точнее, их представление в данной модели. Инфомодель эволюционирует во времени, т.к. пополняются списки значений категориальных атрибутов, добавляются новые атрибуты и единицы измерения.
Вариативность инфомоделей
Вспомним теперь о том, что товары, очень близкие по свойствам (одного назначения), производятся различными компаниями, количество которых может достигать нескольких сотен. У каждого производителя имеется свое собственное описание продукции, а значит, свое разбиение товаров на группы и своя информационная модель для каждой группы. Получается, что хотя производители и говорят практически об одном и том же, они пользуются разными формальными языками.
Это значит, что даже для одной группы товаров существует множество информационных моделей, а универсальной общепринятой модели не существует вовсе.
При создании собственного информационного каталога для интернет-магазина мы вынуждены так или иначе импортировать технические описания товаров извне. Это можно делать вручную силами собственной контент-команды, можно импортировать через API провайдеров контента и поставщиков, можно настраивать иные способы импорта контента из доверенных источников, а также комбинировать одни методы импорта с другими. Так или иначе, возникает задача определения операторов, отображающих внешние информационные модели во внутреннюю.
Кроме того, внутренняя модель также подвергается дальнейшей трансформации для предоставления данных на сайт интернет-магазина, в различные фиды для продвижения товаров на интернет-площадках. А если мы говорим о внутренней модели провайдера контента, то эта модель отображается в многочисленные информационные модели клиентов, приобретающих данный контент.
Таким образом, в общем случае мы имеем задачу двойного преобразования технического контента:
И на каждой из трех звеньев этой цепи мы имеем дело с различными информационными моделями и различным разбиением множества товаров на группы, так что при каждом преобразовании моделей мы вынуждены производить перевод с одного модельного языка на другой.
К сожалению, информационные модели — это не линейные пространства, а преобразование, переводящее одну инфомодель в другую, — не линейный оператор. Поэтому для создания транзитных преобразований (минующих внутренний каталог) отделаться перемножением матриц линейных операторов не удастся. И это не единственная проблема.
Трудности перевода
Перечислим некоторые из трудностей преобразования инфомоделей:
Из перечисленных проблем возникают вопросы-задачи, знакомые всем, кто занимается обработкой (больших) данных.
Атомизированная модель
Если проблема различия разговорных языков решается относительно просто (нужно договориться о том, что и во внутренней модели, и во внешних доверенных источниках будет использоваться только английский язык и метрическая система мер), то различие в группах и наборах атрибутов требует построения такой принимающей модели, в которую бы все внешние атрибуты попали максимально разделенными, декомпозированными. Иначе говоря, операторы, преобразующие внешние инфомодели во внутреннюю модель (операторы импорта) не должны склеивать отдельные атрибуты в один, но вполне могут разделять один сложный атрибут на несколько более простых (т.е. увеличивать размерность инфомодели).
С другой стороны, чтобы максимально упростить синтез новых информационных моделей для клиентской стороны (экспорт), внутренняя модель также должна быть максимально структурирована и разбита на элементарные атрибуты так, чтобы операторы экспорта смогли бы сложить из них максимальное разнообразие внешних моделей (с понижением размерности инфомодели).
Такая атомизированная модель обладает рядом преимуществ по чисто комбинаторным причинам. Действительно, имея в арсенале всего три характеристики A, B, C, мы можем составить из них как минимум 5 (число Белла при n=3) непустых моделей (, , , , ). Эти комбинированные модели могут соответствовать разным внешним моделям, но при этом ложатся в одну внутреннюю модель.
Второе преимущество состоит в том, что такую модель легче модерировать. Если характеристика A задана всего один раз, то ее переименование, пополнение набора значений или единиц измерения, исправление ошибок производится также всего лишь один раз во внутренней системе. Если же мы внутреннюю модель сделаем такой, что в ней будут представлены все возможные комбинации из внешних моделей, то дальнейшее управление усложняется экспоненциально относительно атомизированной модели.
Очистка данных
Помимо проблемы сопоставления атрибутов разных внешних инфомоделей с внутренней моделью существует и проблема “шума” в исходных данных. Во-первых, данные могут быть неполны. Для импорта это не проблема, но это значит, что доверенный источник должен быть дополнен еще каким-то источником. Полнота данных о товаре означает, что в рамках одной информационной модели не существует двух товаров с одинаковым набором значений атрибутов. Полнота, очевидно, зависит от источника данных. Если в одном доверенном источнике относительно мало товаров, то их модель описания может быть бедной, т.к. малого набора атрибутов достаточно для их различия внутри данной модели. При объединении данных из многих доверенных источников полнота может быть утеряна, а значит, во внутренней модели описание товаров должно быть максимально подробным.
Таким образом, имеется необходимость получать данные для одного и того же товара хотя бы из двух-трех источников.
Это же требование делает возможным процесс верификации данных. Дело в том, что все ошибаются, в том числе и сайты производителей. Чтобы выявить ошибки, нужно уметь производить сопоставление импортируемых данных между собой и с описаниями товаров из данной группы. А для корректного сопоставления нам снова требуется единая атомизированная модель. Только в том случае, когда мы можем сопоставить данные из различных источников в рамках одной инфомодели, мы можем также выявить некоторые ошибки и тем самым очистить данные (например, не пропускать в систему противоречащие друг другу значения или пропускать только наиболее вероятные альтернативы).
Почему инфомодель не может быть всеобъемлющей?
Ранее мы уже отмечали, что при создании инфомодели необходимо соблюдать некоторый баланс между полнотой модели и глубиной разделения товаров на группы. Обсудим этот момент подробнее.
Очевидно, что делать одну модель для одного или 10 товаров неразумно хотя бы ввиду сопоставления затрат на создание модели и эффекта от ее использования. Из всего вышесказанного должно быть уже очевидно, что создание инфомодели — дело хлопотное и затратное как по времени, так и по интеллектуальным ресурсам. Если при наличии 1000 товаров в каталоге создавать группы по 10 товаров, то нам потребуется 100 моделей, каждую из которых нужно создать и поддерживать.
Здесь, конечно, есть свои приемы экономии. Например, многие атрибуты (вроде частоты или веса) встречаются во многих моделях. Поэтому их создание и настройку проще вынести в отдельный каталог атрибутов, а модель собирать из них как “лего”.
Но ведь помимо создания модели потребуется еще произвести построение операторов импорта/экспорта, забирающих и отдающих контент во внешние модели. А в этих внешних моделях, как правило, категоризация (разбиение на группы) происходит по своим принципам. Потребуется создать несколько сотен операторов ради одной-двух внешних моделей. Это опять-таки накладно и весьма избыточно.
Наконец, если мы хотим использовать такие вещи, как машинное обучение для выявления ошибок, отклонений и для автоматизации импорта/экспорта данных, нам потребуется достаточно большая группа однородных описаний товаров, обладающих единой инфомоделью. Иначе машинное обучение будет некорректным.
ОК, почему же тогда не создать модель, которая включит все товары каталога? Одна модель требует одного акта творения и, казалось бы, сильно экономит на поддержке.
Однако и у этой крайности есть свои недостатки. Во-первых, эта модель получится крайне разреженной. Вспомним, что товар в инфомодели — это вектор значений атрибутов. Если модель очень широкая, то может оказаться, что каждый товар использует 1-2% атрибутов, хотя все вместе товары используют 100% атрибутов.
У нас получается очень разреженная модель данных, а такие модели как правило очень требовательны к вычислительным ресурсам, поскольку сильно разреженные векторы требуют постоянной упаковки и распаковки для экономии памяти, а значит, производить массовые операции над каталогом становится трудоемкой задачей.
С точки зрения Data Science к такому информационному пространству следует применить алгоритмы понижения размерности, выкинув все незначащие атрибуты и распилив это единое пространство на несколько независимых подпространств, размерность которых будет в разы ниже исходной. Но это и есть не что иное, как переход к группам товаров со схожей информационной моделью (категоризация).
Во-вторых, глобальную информационную модель также необходимо обслуживать — пополнять атрибутами, расширять списки значений, модифицировать операторы импорта/экспорта при таких изменениях. Здесь мы снова упираемся в проблему, когда необходимость внести небольшие изменения затрагивает весь каталог. А кроме того, повышаются риски возникновения дублирующих или перекрывающих атрибутов, поскольку отследить корректность модели становится непосильной для человека задачей.
В-третьих, если внутренняя модель используется для заполнения описаний “руками”, то контент-менеджер будет вынужден подолгу обозревать инфомодель в поисках нужного ему атрибута для простановки значения. А это огромная потеря времени и ресурсов компании.
Против глобальной инфомодели можно привести еще ряд аргументов, связанных с процессами управления каталогом, разделением прав доступа, отслеживанием модификаций модели, автоматизацией проверки качества вносимых значений и т.д.
Таким образом, чаще всего информационные модели строятся на группах очень схожих товаров, соблюдая паритет между всеобъемлемостью и тривиальностью модели. Когда мы имеем дело с товарной группой, где отличие по заполненности модели у товаров составляет 5-10%, мы не только упрощаем себе жизнь в плане управления моделью и привязки к ней операторов импорта/экспорта, но получаем еще ряд бонусов.
Избыточная атомизация модели
В попытках построить максимально элементарную инфомодель можно дойти до такого типа модели, который называется “Да/Нет”-моделью. В такой модели существует ровно два вида атрибутов — числовые (с единицами измерения) и категориальные с одинаковым списком значений <‘Да’,’Нет’>. Очевидно, что любой категориальный атрибут сводится к совокупности “Да/Нет”-атрибутов. Для этого достаточно взять список значений данного категориального атрибута и превратить его в одноименный список атрибутов. Тогда, если в товаре данное значение исходного атрибута присутствует, одноименный “Да/Нет”-атрибут принимает значение ‘Да’, а в противном случае — ‘Нет’.
Такая сверхатомизированная модель имеет право на существование и даже нередко применяется на практике. Однако легко понять, что и она очень сложна для целей сопоставления внешних моделей с внутренними. Достаточно заметить, что добавление нового значения категориального атрибута практически никак не затрагивает формулы операторов импорта/экспорта, в то время как соответствующее добавление “Да/Нет”-атрибута может потребовать правок во многих сопровождающих алгоритмах преобразования инфомоделей.
Кроме того, такая модель будет сильно разреженной и окажется в сотни раз больше исходной модели со списочными атрибутами, в результате чего мы получаем все те проблемы, которые описывали для случая всеобъемлющей модели.
Оправдать пользу “Да/Нет”-модели можно разве что в каталогах с очень простым, слабо меняющимся описанием (вроде каталогов выборных листовок “Да-Да-Нет-Да”), либо если эта модель спрятана “под капотом” системы искусственного интеллекта, который самостоятельно формирует группы товаров и инфомодели для них, самостоятельно создает операторы импорта/экспорта, самостоятельно верифицирует и пополняет данные на основе внешних раздражителей (фидбэков от внешних систем и контролирующих алгоритмов).
Еще одно применение “Да/Нет”-модели — это сопоставление с каким-то внешним каталогом, модель которого имеет такой же тип. В этом случае импорт контента немного усложнится: сначала оператор импорта выполнит заливку во внутреннюю “Да/Нет”-модель, затем другой оператор произведет сопоставление данных с нативной внутренней моделью, содержащей списочные категориальные атрибуты.
Бонусы атомизированной модели
Для начала заметим, что если инфомодель соответствует такой группе товаров, у которых заполнены примерно одни и те же атрибуты, то такие товары легко сравнивать между собой. А это очень важный аспект выбора товара покупателем.
Далее, если модель максимально декомпозирована, то и сравнение товаров в ней, и любая аналитика по имеющемуся контенту (статистический обсчет товарной группы) будут максимально детальными. Пользуясь атомизированной моделью, вы можете как под микроскопом выявить отличия в описаниях товаров, локализовать ошибочные значения, исключить неоднозначное толкование атрибутов, производить поиск зависимых атрибутов и вычислять отсутствующие знания о товаре.
Выше уже отмечалось, что атомизированная модель позволяет порождать большое количество комбинаций атрибутов, что упрощает создание операторов экспорта во внешние модели. Чем мельче элементарный квант модели, тем точнее мы можем выстроить правила экспорта данных для их соответствия требованиям заказчика или маркетплейса.
Ряд бонусов атомизированной модели проявляется тогда, когда мы говорим о системе управления контентом и ее интерфейсах.
Прежде всего, мы можем накладывать ограничения на допустимые значения атрибутов при вводе их как человеком-оператором, так и оператором импорта. Например, для числового атрибута можно задать ограничивающий диапазон либо превентивно, исходя из его физического смысла, либо на основе статанализа значений для ранее описанных товаров.
Можно также запретить вводить дробные значения для атрибутов количества или ограничить число знаков после запятой для значений частоты процессора.
В случае категориальных атрибутов часто используется ограничение на количество одновременно вводимых значений. Так, атрибуты подтипа “селект” позволяют выбрать только одно значение.
Наконец, можно выполнять перекрестную проверку значений и/или восполнение знаний о товаре. А именно, из физических соображений можно связать атрибуты формулами так, что если часть введенных значений позволяет однозначно вычислить остальные, то мы можем либо автоматически заполнить недостающие атрибуты, либо проверить правильность их заполнения.
Категориальные атрибуты с фиксированными списками значений и заданными у этих значений синонимами, а также с иерархией значений позволяют контролировать возникновение дублирующих атрибутов и значений. Отсутствие дублирующих фрагментов инфомодели означает более качественное ее использование при импорте/экспорте данных и более качественный поиск и сравнение товаров.
Еще одним важным бонусом атомизированной модели является то, что с помощью операторов экспорта из нее можно генерировать не только таблицу технических характеристик, которая больше ориентирована на читабельность, но и отдельный список фильтров для сайта, который будет включать более структурированные атрибуты, а также отдельный список атрибутов для таблицы сравнения товаров. Кроме того, можно строить экспорт SEO-текстов и метатегов, автоматическую генерацию наименований товаров и кратких описаний.
Ранее мы отмечали, что при создании модели и выборе источников лучше использовать один язык — английский. Однако внешние клиентские каталоги могут требовать контент на различных языках. Наличие атомизированной модели позволяет создавать словари токенов для перевода атрибутов, значений и единиц измерения на другие языки. Здесь важно, чтобы как названия атрибутов, так и их значения были максимально цельными с лингвистической точки зрения, что позволит нивелировать неоднозначность перевода.
В завершение заметим, что, имея качественное и хорошо структурированное техническое описание товара, мы можем применять алгоритмы машинного поиска других видов контента — изображений, документации, видеороликов, маркетинговых текстов и т.п.
Подводя итоги, зафиксируем тезисно основные выводы: