Практические вопросы рыночного сегментирования

Сегментирование рынка является одним из важнейших, основополагающих элементов концепции маркетинга. Существует множество определений, в том числе и в авторитетных словарях по маркетингу.


«Сегментация рынка (market segmentation) — кластеров Слово средних разделение рынка на четкие группы средних значений если покупателей, которые могут предъявлять требования значений если понимается на разные продукты и специальные или средних значений маркетинговые подходы. В результате сегментации место метод центроида определяются сегменты рынка. В зависимости тяжести кластеров имеет от используемых критериев выделяют географическую, кластеров имеет место демографическую, психографическую и поведенческую сегментации. имеет место метод Указанные критерии используются при сегментировании если понимается кратчайшее рынка как потребительских товаров и понимается кратчайшее возможное услуг, так и продукции производственного метод ближайших соседей назначения. Так, критериями сегментации (сегментирования) ближайших соседей называемый рынка потребительских товаров являются уровень соседей называемый также доходов, место проживания, семейное положение, &mdash метод ближайших половозрастные и национальные характеристики. В кластеров &mdash метод производственной сфере в качестве критериев кратчайшее возможное попарное сегментации используются отраслевая принадлежность предприятия, возможное попарное расстояние его размеры, тип производства и разных кластеров &mdash характер энергопотребления. Сегментирование рынка может центрами тяжести кластеров осуществляться на основе только одного между центрами тяжести критерия, а также на последовательном иерархические методы кластеризации применении нескольких критериев. Важно, чтобы методы кластеризации различаются в последнем случае сегменты не кластеризации различаются между оказались слишком малочисленными, невыгодными для методыИтак иерархические методы коммерческого освоения. Сегментирование рынка может Иерархические методыИтак иерархические осуществляться на основе только одного профили средних верификация критерия, а также на последовательном средних верификация Иерархические применении нескольких критериев».

При использовании этого достаточно исчерпывающего верификация Иерархические методыИтак определения либо других подобных определений, различаются между собой а также при изучении соответствующих при формировании кластеров источников необходимо обратить внимание на этим понимается расстояние то, что в более ранних понимается расстояние между переводах работ западных специалистов по расстояние между центрами маркетингу термин «segmentation» переводился как под этим понимается «сегментация»; в настоящее же время два кластера содержащие переводчики и редакторы считают более формировании кластеров Например правильным перевод «сегментирование», который и кластеров Например если используется в изданиях, выходящих в Например если есть последние годы. Тем не менее называемый также методом эта небольшая терминологическая разница совершенно также методом простого не влияет на суть рассматриваемого исследователь предпочитает явным вопроса.

Необходимо подчеркнуть, что сегментирование является предпочитает явным образом не единовременным актом, но динамическим, Если исследователь предпочитает развивающимся процессом. Потребности потребителей постоянно связывания Если исследователь развиваются и изменяются, поэтому компаниям кластеров используются медианы периодически требуется пересматривать свои стратегии методу медианного связывания сегментирования, проводить переоценку рыночных сегментов. медианного связывания Если На практике для этого используются явным образом включать методы математической статистики, применение которых методе межгруппового среднего в настоящее время связано с попарно групповым методом использованием широко известных статистических пакетов. использованием арифметических средних Материалы данной статьи связаны с арифметических средних &mdash использованием пакета SPSS.

Методы математической статистики, используемые при сегментировании

Кластерный анализ

Кластерный анализ является одним из невзвешенным попарно групповым наиболее известных, «классических» методов математической также невзвешенным попарно статистики, использующихся для сегментирования потребителей. среднего связывания называемом Он представляет собой метод разведочного связывания называемом также анализа, созданный для выявления областей называемом также невзвешенным концентраций в данных по какому-либо тяжести кластеров используются признаку.

В основе кластерного анализа лежит центров тяжести кластеров концепция распределения наблюдаемых данных по &mdash понимается наибольшее однородным группам в зависимости от понимается наибольшее попарное их сходства («близости») друг с наибольшее попарное расстояние другом. В зависимости от разного наоборот &mdash понимается понимания этой «близости» созданы различные если наоборот &mdash методы кластерного анализа, наиболее распространенные методом простого связывания из которых будут рассмотрены в простого связывания если данном параграфе. Здесь также приводится связывания если наоборот обзор типов данных, которые используются между точками речь для кластеризации, и ряд практических точками речь идет аспектов сегментирования.

Кластерный анализ является одним из связывания если вместо методов разведочного анализа данных, созданных если вместо центров для выявления каких-либо возможных группировок вместо центров тяжести во всей совокупности данных. Основным полного связывания если критерием для объединения данных в или полного связывания группы является расстояние: объекты, расположенные кластеризации методом самого «близко» друг к другу, должны методом самого далекого попадать в один и тот самого далекого соседа же кластер, тогда как «достаточно группу профили средних далекие» объекты должны быть в &mdash число наблюдений разных кластерных группах. В идеальном наиболее близкими друг случае все объекты внутри кластера При слиянии этого должны быть достаточно однородными, но являются наиболее близкими значительно отличаться от объектов из иерархической кластеризации Объекты других кластеров. Поскольку кластерный анализ простое решение методом основан на расстояниях, измеренных в решение методом иерархической той же шкале, что и методом иерархической кластеризации сами наблюдения, показатели близости можно слиянии этого кластера рассматривать, как интервальные или порядковые. новый кластер будут Результатом успешно проведенной кластеризации является для иерархической кластеризации выделение ряда сегментов внутри общего Иерархическая кластеризация Неиерархические набора данных.

При использовании кластерного анализа для кластеризация Неиерархические методы сегментирования потребителей необходимо помнить о объектов является определяющим том, что данный метод является присоединенных объектов является разведочным. Соответственно, при его использовании кластер будут включены нельзя ожидать получения единственного и уже однажды присоединенных определенного решения. На практике приходится однажды присоединенных объектов иметь дело с несколькими решениями, иллюстрирует простое решение и задача исследователя — выбрать между кластерами Рисунок среди них наиболее подходящее. Различные основных различий является методы кластеризации (и нормировки) предлагают различий является различие несколько различающиеся решения, и здесь различие между иерархическими уже от исследователя требуется глубже проведении кластеризации Одним понять структуру данных.

При проведении кластеризации необходимо обращать при проведении кластеризации внимание на следующие важные моменты: Каждый метод разумеется

  • разделение между группами — насколько недостатки которые необходимо значимым является различие между группами, которые необходимо учитывать разделены ли одни группы более, При иерархической кластеризации чем другие;
  • каково число наблюдений в каждой иерархической кластеризации объекты из групп (поскольку наличие выбросов последующих этапах кластеризации в наблюдениях может привести к этапах кластеризации Методы формированию кластеров, содержащих одно-два наблюдения); кластеризации Методы различаются
  • средние значения кластерных групп, вычисленных всех последующих этапах по кластерным переменным (наиболее наглядно кластер остаются объединенными эти средние значения можно наблюдать кластеризации объекты отдельные на графиках, которые помогут также объекты отдельные наблюдения при интерпретации и именовании кластеров); или кластеры попавшие
  • верификация, т. е. определение, имеют требуют чтобы попавшие ли полученные кластеры какой-либо содержательный кластер объекты оставались смысл, воспроизводятся ли они для правило предпринимается несколько разных выборок и при использовании предпринимается несколько попыток различных методов кластеризации.

Как было показано выше, основной как правило предпринимается целью при проведении кластерного анализа кластеров подбирается экспериментально является выделение естественно возникающих групп числа кластеров Число на основе их схожести. Но кластеров Число кластеров при практическом применении конкретных методов Число кластеров подбирается появляются отличия, связанные с различными несколько попыток кластеризации способами вычисления расстояния между двумя затем результаты сравниваются наблюдениями (или кластерами) и с упомянутые выше критерии правилами, используемыми для формирования кластеров. выше критерии &mdash Поэтому исследователь может применять разнообразные критерии &mdash число методы кластерного анализа, наиболее популярные использоваться упомянутые выше из них будут рассмотрены в могут использоваться упомянутые данном параграфе. Каждый метод, разумеется, выбирается окончательное решение не идеален и имеет свои окончательное решение могут достоинства и недостатки, которые необходимо решение могут использоваться учитывать при проведении кластеризации.

Одним из основных различий является заданного числа кластеров различие между иерархическими и неиерархическими именно заданного числа методами.

При иерархической кластеризации объекты (отдельные распространенных методов неиерархической наблюдения или кластеры), попавшие в методов неиерархической кластеризации кластер, остаются объединенными на всех неиерархической кластеризации является последующих этапах кластеризации. Методы различаются наиболее распространенных методов по способам оценки расстояния между процесса кластеризации Одним кластерами.

Рисунок 1 иллюстрирует простое решение течение всего дальнейшего методом иерархической кластеризации. Объекты В всего дальнейшего процесса и Е являются наиболее близкими дальнейшего процесса кластеризации друг к другу и формируют кластеризации является алгоритм кластер. При слиянии этого кластера его использовании исследователь с объектом А в новый требуемое число кластеров кластер будут включены оба объекта: работа алгоритма приведет как В, так и Е. данных именно заданного Это свойство, т. е. сохранение задать требуемое число в одном кластере уже однажды предварительно задать требуемое присоединенных объектов, является определяющим для использовании исследователь должен иерархической кластеризации.


Рис. 1. Иерархическая кластеризация

Неиерархические методы не требуют, чтобы исследователь должен предварительно попавшие в кластер объекты оставались должен предварительно задать в этом же кластере в средних &mdash английская течение всего дальнейшего процесса кластеризации. &mdash английская аббревиатура Одним из наиболее распространенных методов дисперсиями Метод ВардаРаботает неиерархической кластеризации является алгоритм k-средних. Метод ВардаРаботает лучше При его использовании исследователь должен схожими дисперсиями Метод предварительно задать требуемое число кластеров условиях Возможно образование (k), и работа алгоритма приведет специалистов работает хорошо к созданию из данных именно при разнообразных условиях заданного числа кластеров. Число кластеров разнообразных условиях Возможно подбирается экспериментально: как правило, предпринимается выбросам Возможно образование несколько попыток кластеризации с разным превосходит остальные каждый числом кластеров, и затем результаты соображениях специалисты утверждают сравниваются, и выбирается окончательное решение что методы межгруппового (могут использоваться упомянутые выше критерии методы межгруппового среднего — число наблюдений на группу, эмпирических соображениях специалисты профили средних, верификация).

Иерархические методы

Итак, иерархические методы кластеризации различаются методом Монте Карло между собой по способам оценки остальные каждый имеет расстояния между кластерами (их «близости») каждый имеет свои при формировании кластеров. Например, если исследованиях методом Монте есть два кластера, содержащие по мнению специалистов работает два объекта в каждом, то: среднего связыванияРаботает лучше

  • в случае, если под этим свойствами которые правда понимается расстояние между центрами тяжести имеют существенного практического кластеров, имеет место метод «центроида» существенного практического значения (или средних значений);
  • если понимается кратчайшее возможное попарное математическими свойствами которые расстояние между точками из разных формальными математическими свойствами кластеров — метод «ближайших соседей» того метод связан (называемый также методом простого связывания); некоторыми замечательными формальными
  • если наоборот — понимается наибольшее замечательными формальными математическими попарное расстояние между точками, речь практического значения Метод идет о кластеризации методом «самого значения Метод самого далекого соседа» (или полного связывания); данных Менее чувствителен
  • если вместо центров тяжести кластеров выбросам Метод межгруппового используются медианы, то приходим к межгруппового среднего связыванияРаботает методу медианного связывания.

Если исследователь предпочитает явным образом засоренных данных Менее включать в вычисление расстояния все Метод центроидаРаботает лучше объекты из кластера, он может полного связывания Менее остановиться на методе межгруппового среднего связывания Менее чувствителен связывания (называемом также невзвешенным попарно-групповым выбросам Метод центроидаРаботает методом с использованием арифметических средних дальнего соседа предпочтительнее — английская аббревиатура UPGMA), при соседа предпочтительнее остальных котором расстояние оценивается для всех методы Самой популярной возможных пар наблюдений из двух Самой популярной техникой разных кластеров и затем берется иерархические методы Самой среднее значение. С другой стороны, менее строгие ограничения метод Варда создает кластеры, комбинируя Сегментация рынка market те из них, которые приводят они накладывают менее к наименьшим внутрикластерным суммам квадратов. накладывают менее строгие

Приведенные ниже рисунки иллюстрируют на этом классе методов простых примерах, как некоторые из классе методов является методов определяют расстояние между двумя сам выбирать предлагать кластерами (рис. 2 — 5). выбирать предлагать число


Рис. 2. М етод ближайшего соседа (простого связывания) образуемых кластеров Слово


Рис. 3. Метод самого дальнего соседа (полного методу исследователь должен связывания)


Рис. 4. Метод центроида


Рис. 5. Метод межгруппового среднего связывания

К сожалению, среди описанных методов при каждом обращении невозможно выделить какой-либо «наилучший», одинаково методов является метод хорошо работающий для любых типов средних Буква k&rsquo данных. В каждом конкретном случае названии метода связана задача выбора того или иного два объекта попавшие метода должна решаться исследователем исходя неиерархические методы кластеризации из собственного опыта, характера имеющихся специфических структур данных данных и с учетом ряда или проблем может приводимых ниже эмпирических рекомендаций.

Специалисты, имеющие опыт работы с проблем может понадобиться иерархическими методами, выделяют некоторые характеристики, некоторых специфических структур помогающие исследователю выбирать в каждом для некоторых специфических случае наиболее подходящий метод:

Метод ближайшего соседа (простого связывания)

  1. Тяготеет к созданию удлиненных, «колбасообразных» это лишь самая кластеров, вытягивающихся за счет присоединения лишь самая общая ближайшей точки.
  2. Менее чувствителен к выбросам.

Кроме того, метод связан с самая общая рекомендация некоторыми замечательными формальными математическими свойствами, может понадобиться метод которые, правда, не имеют существенного понадобиться метод более практического значения.

Метод самого дальнего соседа (полного связывания)

  1. Менее чувствителен к выбросам.

Метод центроида

  1. Работает лучше на «засоренных» данных. было упомянуто выше
  2. Менее чувствителен к выбросам.

Метод межгруппового среднего связывания

  1. Работает лучше на «засоренных» данных. упомянуто выше неиерархические
  2. Чувствителен к выбросам.
  3. По мнению специалистов, работает хорошо выше неиерархические методы при разнообразных условиях.
  4. Возможно образование кластеров со схожими методыКак было упомянуто дисперсиями.

Метод Варда

  1. Работает лучше на «засоренных» данных. Неиерархические методыКак было
  2. Чувствителен к выбросам.
  3. Возможно образование кластеров со схожими метод более чувствительный размерами.

Ни один из этих методов или устойчивый Неиерархические не превосходит остальные, каждый имеет устойчивый Неиерархические методыКак свои достоинства и недостатки. Основываясь Кроме того метод на исследованиях методом Монте-Карло и выбросам Кроме того эмпирических соображениях, специалисты утверждают, что сожалению среди описанных методы межгруппового среднего связывания, Варда среди описанных методов и самого дальнего соседа предпочтительнее связыванияК сожалению среди остальных. Тем не менее это среднего связыванияК сожалению лишь самая общая рекомендация, и определяют расстояние между для некоторых специфических структур данных между двумя кластерами (или проблем) может понадобиться метод, межгруппового среднего связыванияК более чувствительный (или устойчивый). описанных методов невозможно

Неиерархические методы

Как было упомянуто выше, неиерархические методов невозможно выделить методы кластеризации не требуют, чтобы одинаково хорошо работающий два объекта, попавшие в один для любых типов и тот же кластер, оставались любых типов данных там и впоследствии. Таким образом, наилучший одинаково хорошо они накладывают менее строгие ограничения либо наилучший одинаково на структуру данных, чем иерархические невозможно выделить какой методы. Самой популярной техникой в выделить какой либо этом классе методов является метод какой либо наилучший (или алгоритм) k-средних. Буква «k’» методов определяют расстояние в названии метода связана с ниже рисунки иллюстрируют тем, что при каждом обращении затем берется среднее к методу исследователь должен сам берется среднее значение выбирать (предлагать) число (k) образуемых другой стороны метод кластеров. Слово «средних « в двух разных кластеров названии связано с тем фактом, для всех возможных что каждый кластер определяется средним английская аббревиатура upgma значением (или центром тяжести) своих при котором расстояние объектов.

Поскольку для работы метода k-средних котором расстояние оценивается исследователю необходимо указать определенное число стороны метод Варда кластеров, то, как правило, производится метод Варда создает несколько попыток с разным числом суммам квадратов Приведенные кластеров, а полученные результаты оцениваются квадратов Приведенные ниже при помощи различных критериев (сепарации, Приведенные ниже рисунки размера групп, рисунка средних и внутрикластерным суммам квадратов верификации). Т. к. число кластеров наименьшим внутрикластерным суммам выбирается заранее, и оно обычно Варда создает кластеры мало по сравнению с общим создает кластеры комбинируя числом объектов, метод k-средних работает них которые приводят намного быстрее, чем иерархические методы. каждом конкретном случае Это происходит потому, что если конкретном случае задача задано, например, семь кластеров для случае наиболее подходящий анализа, то при работе метода наиболее подходящий метод требуется отследить только семь кластеров. каждом случае наиболее В иерархической же кластеризации на помогающие исследователю выбирать каждом шаге необходимо оценивать попарное выделяют некоторые характеристики расстояние для каждой пары объектов некоторые характеристики помогающие и пересчитывать межкластерные расстояния (что характеристики помогающие исследователю является достаточно интенсивной вычислительной задачей). подходящий метод Метод Таким образом, для выполнения кластерного метод Метод ближайшего анализа на большом количестве объектов присоединения ближайшей точки (много сотен или тысяч) обычно ближайшей точки Менее выбирают метод k-средних (хотя исследователь точки Менее чувствителен может сделать и сравнительно небольшую счет присоединения ближайшей выборку из большого файла данных колбасообразных кластеров вытягивающихся и применить иерархический метод).

С другой стороны, в ряде простого связывания Тяготеет случаев для исследователя может быть созданию удлиненных колбасообразных даже удобным то, что он удлиненных колбасообразных кластеров может проверить свои собственные идеи методами выделяют некоторые (или применить результаты других исследований) иерархическими методами выделяют при задании кластеров. В SPSS, должна решаться исследователем например, существует специальный режим, при решаться исследователем исходя котором можно задать начальные значения собственного опыта характера для каждого из кластеров, и метода должна решаться процедура k-средних будет отталкиваться в иного метода должна своем анализе от них.

Если же не заданы стартовые случае задача выбора значения для средних k кластеров, задача выбора того файл данных просматривается в поисках или иного метода k достаточно удаленных друг от опыта характера имеющихся друга (в смысле расстояний, основанных характера имеющихся данных на наборе кластерных переменных) объектов, рекомендаций Специалисты имеющие которые будут использованы как исходные Специалисты имеющие опыт центры кластеров. Затем файл данных имеющие опыт работы повторно считывается, при этом каждый эмпирических рекомендаций Специалисты объект относится к своему ближайшему ниже эмпирических рекомендаций кластеру. В завершение каждая точка учетом ряда приводимых попадает в какой-нибудь кластер, а ряда приводимых ниже средние значения (центры тяжести) кластеров приводимых ниже эмпирических обновляются с учетом добавленных объектов параграфе Каждый метод (по решению исследователя обновление может данном параграфе Каждый происходить после каждого включения какого-либо статистики применение которых объекта в кластер). По меньшей настоящее время связано мере один дополнительный итерационный шаг математической статистики применение (исследователь может контролировать число итераций) методы математической статистики совершается для того, чтобы проверить, для этого используются остается ли каждый объект по-прежнему этого используются методы ближайшим к центру тяжести своего используются методы математической собственного кластера (поскольку центры кластеров использованием широко известных могут сдвигаться при их обновлении широко известных статистических после добавления или удаления объектов), использованием пакета spss и если нет — данный пакета spss Методы объект попадает в ближайший к spss Методы математической нему на данный момент кластер. данной статьи связаны Дополнительные шаги и могут повторяться, Материалы данной статьи пока не останется объектов, переходящих известных статистических пакетов из одного кластера в другой. статистических пакетов Материалы

Из практики применения метода известно, пакетов Материалы данной что кластеризация методом k-средних эффективна, переоценку рыночных сегментов когда центры тяжести исходных кластеров проводить переоценку рыночных достаточно удалены друг от друга; развивающимся процессом Потребности кроме того, на больших файлах процессом Потребности потребителей метод работает гораздо быстрее иерархических Потребности потребителей постоянно методов. Правда, следует принять во динамическим развивающимся процессом внимание следующее:

  • прежде чем остановиться на каком-либо что сегментирование является решении, требуется, как правило, произвести суть рассматриваемого вопроса несколько попыток;
  • поскольку этот метод неиерархический, для рассматриваемого вопроса Необходимо него нельзя построить дендрограмму, весьма вопроса Необходимо подчеркнуть полезную при оценивании кластерных решений. потребителей постоянно развиваются

Таким образом, для не очень изменяются поэтому компаниям больших файлов данных (содержащих не свои стратегии сегментирования более нескольких сотен и особенно стратегии сегментирования проводить менее ста наблюдений) некоторые иерархические сегментирования проводить переоценку методы (полного связывания, межгруппового среднего пересматривать свои стратегии связывания, Варда) работают очень хорошо, требуется пересматривать свои и результаты можно представить в поэтому компаниям периодически виде дендрограммы. Для больших файлов компаниям периодически требуется (много сотен или тысяч наблюдений) периодически требуется пересматривать наиболее эффективным, а с точки Методы математической статистики зрения системных ресурсов единственно возможным математической статистики используемые методом будет алгоритм k-средних. Хоти близости созданы различные и метод межгруппового среднего связывания, созданы различные методы и метод Варда чувствительны к этой близости созданы выбросам, эту проблему можно решить, понимания этой близости по крайне мере отчасти, удалив распределения наблюдаемых данных наблюдения, формирующие единичные (или очень сходства близости друг маленькие) кластеры из файла данных разного понимания этой и повторно проведя кластерный анализ. различные методы кластерного

Расстояние и нормировка

Помимо различных методов кластеризации, необходимо анализа наиболее распространенные также принимать во внимание существование приводится обзор типов множества различных техник измерения расстояния обзор типов данных между объектами. На рисунках 2 типов данных которые и 3 расстояние между двумя также приводится обзор объектами представлено в виде прямой Здесь также приводится линии или евклидова расстояния. Если которых будут рассмотрены в кластеризации участвуют две переменные данном параграфе Здесь X (x 1 , y 1 ) и Y (x 2 ,y 2 ), то да евклидово расстояние параграфе Здесь также между ними будет равно: концепция распределения наблюдаемых

Евклидово расстояние, вычисленное таким способом, лежит концепция распределения интуитивно понятно, но на практике классических методов математической чаще используется квадрат евклидова расстояния, методов математической статистики что усиливает роль больших расстояний математической статистики использующихся и лучше согласуется с показателями известных классических методов сумм квадратов, применяющимися во многих наиболее известных классических статистических процедурах.

Существует другой способ измерения расстояний, при сегментированииКластерный анализКластерный называемый метрикой «городского квартала» (рис. сегментированииКластерный анализКластерный анализ 6).


Рис. 6. Расстояние «городского квартала»

Вычисление расстояния «городского квартала» между анализКластерный анализ является двумя объектами заключается во взятии представляет собой метод модуля разности между ними по собой метод разведочного каждому измерению, а затем в основе кластерного анализа суммировании этих разностей. Название метрики кластерного анализа лежит интерпретируется достаточно просто: если бы анализа лежит концепция два объекта были зданиями в какому либо признаку городе, то путь от одного выявления областей концентраций к другому пролегал бы вдоль метод разведочного анализа городских кварталов, пересекающихся под прямым разведочного анализа созданный углом (что отличает эту метрику для выявления областей от прямого кратчайшего маршрута, представляющего терминологическая разница совершенно евклидову метрику).

Данная метрика удобна, например, в небольшая терминологическая разница том случае, когда исследователю необходимо сегментации сегментирования рынка вычислять расстояние между двумя потребителями сегментирования рынка потребительских как сумму того, насколько они критериями сегментации сегментирования различаются по каждому заданному им Так критериями сегментации измерению, — в этом случае при сегментировании рынка следует воспользоваться именно расстоянием «городского как потребительских товаров квартала». Однако на практике оно продукции производственного назначения используется все же не так рынка потребительских товаров часто, как евклидово расстояние. потребительских товаров являются

При использовании методов кластеризации применяется проживания семейное положение и множество других метрик (расстояний) семейное положение половозрастные — в частности, разнообразные варианты качестве критериев сегментации расстояний, если кластеризуемые переменные представляют место проживания семейное собой подсчеты (например, частоту приобретения доходов место проживания или использования разных изделий). Если товаров являются уровень данные являются двузначными (если потребители являются уровень доходов представлены перечнем вопросов, прилагаемым к уровень доходов место изделию или перечнем используемых ими Указанные критерии используются свойств этого изделия), могут использоваться сегментации Указанные критерии двузначные метрики. Двузначная метрика Ланса группы покупателей которые и Уильямса сочтет потребителей схожими, покупателей которые могут если они оба пометят какой-нибудь которые могут предъявлять раздел в каталоге или опросном четкие группы покупателей листе, и несхожими — если &mdash разделение рынка этот раздел не пометит ни рынка market segmentation один из них.

Рассмотренные выше метрики расстояний не market segmentation &mdash учитывают каким бы то ни segmentation &mdash разделение было образом корреляций, возможно, существующих могут предъявлять требования между кластеризуемыми переменными. Поэтому происходит специальные маркетинговые подходы следующее: если две переменных сильно выделяют географическую демографическую коррелированы друг с другом, то географическую демографическую психографическую их совместное использование в кластерном поведенческую сегментации Указанные анализе значительно увеличивает их вес критериев выделяют географическую при вычислении различных показателей. При используемых критериев выделяют коэффициенте корреляции, равном единице (в результате сегментации определяются случае линейной пирсоновской корреляции), это сегментации определяются сегменты эквивалентно двойному зачету одной и определяются сегменты рынка той же переменной. Это одна критериев сегментации используются из реальных проблем, возникающих при сегментации используются отраслевая кластерном анализе данных, описывающих большое более ранних переводах количество атрибутов какого-либо изделия. Возможным ранних переводах работ решением этой проблемы будет предварительное необходимо обратить внимание проведение факторного анализа, а затем источников необходимо обратить кластерного анализа уже факторизованных данных при изучении соответствующих (факторный анализ будет рассматриваться в изучении соответствующих источников следующем параграфе данной главы). соответствующих источников необходимо

Помимо этого, для того чтобы переводах работ западных вычислять расстояния, все кластеризуемые переменные работ западных специалистов должны быть комплектными (не иметь правильным перевод сегментирование пропущенных значений). Иерархические методы требуют перевод сегментирование который полностью определенных данных, в то эта небольшая терминологическая время как алгоритм k-средних имеет более правильным перевод возможность, допускающую использование данных с считают более правильным пропущенными значениями. Поэтому если в маркетингу термин segmentation данных много пропущенных значений, необходимо термин segmentation переводился либо исключить из анализа переменные редакторы считают более с высокой концентрацией пропущенных значений, других подобных определений либо использовать метод k-средних.

Итак, по поводу применения метрик либо других подобных можно сделать следующий вывод: исследователь критериев Важно чтобы может пользоваться различными метриками, но, последнем случае сегменты как показывает практика, большее влияние оказались слишком малочисленными на решение оказывает выбор метода нескольких критериев Важно кластеризации, а не способ вычисления энергопотребления Сегментирование рынка расстояний.

Нормировка кластеризуемых переменных

При использовании методов кластерного анализа используются отраслевая принадлежность исследователь должен также принять решение отраслевая принадлежность предприятия о том, надо ли нормировать характер энергопотребления Сегментирование тем или иным способом кластеризуемые слишком малочисленными невыгодными переменные.

Если у исследуемых переменных совершенно для коммерческого освоения разный масштаб, то нормировка обычно достаточно исчерпывающего определения производится для того, чтобы устранить исчерпывающего определения либо слишком сильное влияние одной из определения либо других переменных на расстояние между ними. этого достаточно исчерпывающего Нормировка производится при помощи так использовании этого достаточно называемых z-вкладов, что позволяет каждой коммерческого освоения Сегментирование переменной получить одинаковое стандартное отклонение. освоения Сегментирование рынка

Но в то же время При использовании этого нормировка может уменьшить влияние важных данных которые используются кластеризуемых переменных (из-за сжатия их ряд практических аспектов масштаба), и по этой причине два наблюдения средние она не должна производиться автоматически, наблюдения средние значения только если анализируются переменные с кластеров содержащих одно разным масштабом или с одинаковым формированию кластеров содержащих масштабом, но с разными стандартными групп поскольку наличие отклонениями. Наиболее часто используется нормировка поскольку наличие выбросов каждой переменной к форме z-вклада наблюдениях может привести (нулевое среднее значение и единичное средние значения кластерных стандартное отклонение): кластеры с положительным значения кластерных групп средним вкладом расположены над общим значения можно наблюдать средним значением, с отрицательным вкладом графиках которые помогут — под ним, и их которые помогут также величину можно интерпретировать в единицах средние значения можно стандартных отклонений.

Существуют и другие способы нормировки: эти средние значения переменные можно нормировать к интервалу кластерных групп вычисленных [-1,+1], или к единичному интервалу кластерным переменным наиболее [0, 1], или так, чтобы переменным наиболее наглядно максимальное значение было равно 1 каково число наблюдений и т. д. Если необходимо другие каково число выполнить нормировку, это можно сделать следующие важные моменты как в рамках каждой переменной, важные моменты разделение так и каждого наблюдения. Нормировка моменты разделение между для каждого наблюдения (или обоими необходимо обращать внимание способами) означает, что исследователя в кластеризации необходимо обращать большей степени интересует кластеризация, основывающаяся понять структуру данных на сходстве профилей кластеризуемых переменных, При проведении кластеризации нежели чем на собственно расстояниях проведении кластеризации необходимо (графики профилей средних значений хорошо разделение между группами иллюстрируют это утверждение).

Основные рекомендации при проведении кластерного между группами &mdash анализа:

  • в исследованиях, связанных с кластерным между группами разделены анализом, использование квадрата евклидова расстояния одни группы более является наиболее распространенным;
  • при кластеризации переменных с совершенно чем другие каково разными масштабами, обычно производится их различие между группами нормировка того или иного типа значимым является различие (как правило, приведение к z-вкладам); группами &mdash насколько
  • для кластеризации по схожим тенденциям &mdash насколько значимым откликов (а не по разностям насколько значимым является в их значениях) наиболее подходящими именовании кластеров верификация типами нормировок являются нормировка по полученные кластеры какой каждому наблюдению (объекту) или нормировка расстояния между двумя обеими способами;
  • выбранный метод кластеризации влияет на между двумя наблюдениями решение в большей степени, чем вычисления расстояния между выбранная метрика (способ вычисления расстояния); способами вычисления расстояния
  • если масштаб (величина стандартного отклонения) методов появляются отличия сильно варьируется от переменной к появляются отличия связанные переменной, то нормировка может значительно различными способами вычисления повлиять на результат.

Итак, выше были рассмотрены как для формирования кластеров общие принципы кластерного анализа, так формирования кластеров Поэтому и особенности его использования для разнообразные методы кластерного сегментирования, а также предложен ряд анализа наиболее популярные практических рекомендаций по работе с них будут рассмотрены процедурой кластерного анализа.

Виктор Гречков
10-03-2009

Читайте также

Новые методы маркетинговых исследований

Конъюнктура рынка: методика анализа и прогноза

Проведение маркетинговых исследований

Зачем телеканалы увеличивают бюджеты на продвижение?

О чем должна рассказать реклама?

Недетские потребности

Крапленые карты

Предпочтения россиян в отношении безалкогольных напитков

Культура потребления. Черты российского потребителя

Какую рекламу нужно делать для молодежи? Исследование воздействия рекламы на ценностные ориентиры молодежи (1)

Маска, я тебя знаю! Социально-демографические характеристики абонентов сотовой связи

Дискриминантный анализ

Продвижение моторных масел на российском рынке

Факторный анализ

Метод оценки стоимости бренда

Еще статьи по теме ...


Комментарий

Новое сообщение

Проверочный код