데이터마이닝 기법과 응용 예제

마케팅과 보안은 관련이 없는 것처럼 보일 수 있는 두 가지 측면이지만, 그들은 (또는 가야 한다) 손을 잡고 있습니다. 오염된 데이터베이스를 사용하여 수행된 DEM(직접 이메일 마케팅) 캠페인의 비참한 효과를 상상해 보십시오. 침입자에 의해 감염된 데이터베이스(해커가 추가한 개별 값 또는 데이터를 복제하는 바이러스)를 사용하지 않으려면 데이터베이스를 오염 을 제거하고 보안을 강화하는 데이터 마이닝 기술인 침입자를 검색하는 것으로 충분합니다. 전체 시스템을 대규모 데이터 집합에서 패턴을 검색하는 프로세스인 데이터 마이닝은 많은 응용 프로그램에서 사용되었습니다. 데이터에는 서로 다른 시간에 생성되고 기록된 특성이 포함될 수 있습니다. 이 경우 데이터에서 의미 있는 관계를 찾는 데 는 특성의 시간적 순서를 고려해야 할 수 있습니다. 시간적 관계는 인과 관계 또는 단순히 연관성을 나타낼 수 있습니다. [인용 필요] 미래를 말할 수 있는 것은 모든 마케팅 전문가의 꿈입니다. 따라서 크리스탈 볼에 의존하지 않고도 회귀 분석에서 데이터 마이닝 기술을 사용하여 광고 캠페인 예산 또는 이와 유사한 비용과 같은 기준과 관련된 변경 사항, 습관, 고객 만족도 수준 및 기타 요인을 연구할 수 있습니다. . 이러한 기준 중 하나가 변경되면 사용자 분지에 어떤 일이 일어날지 에 대한 매우 명확한 아이디어를 갖게 됩니다. 데이터 변환 작업은 마이닝 프로세스의 성공에 기여할 것입니다.

이 분석은 데이터 및 메타데이터에 대한 중요하고 관련있는 정보를 검색하는 데 사용됩니다. 다른 클래스에서 다른 데이터를 분류하는 데 사용됩니다. 분류는 데이터 레코드를 클래스라는 다른 세그먼트로 분할하는 방식으로 클러스터링하는 것과 유사합니다. 그러나 클러스터링과 달리 데이터 분석가는 서로 다른 클래스 또는 클러스터에 대한 지식을 갖게 됩니다. 따라서 분류 분석에서는 알고리즘을 적용하여 새 데이터를 분류하는 방법을 결정합니다. 분류 분석의 전형적인 예는 Outlook 전자 메일입니다. Outlook에서 특정 알고리즘을 사용하여 전자 메일을 합법적인 또는 스팸으로 특성화합니다. 정규화: 특성 데이터가 축소된 경우 정규화가 수행됩니다. 예: 데이터는 정규화 후 -2.0에서 2.0 범위로 떨어질 수 있습니다.

Comments are closed