종료

[SW페스티벌] 한동 데이터 시각화 경진대회

[SW페스티벌] 한동 데이터 시각화 경진대회

기간

2021년 10월 3일 ~2021년 11월 21일 밤 12시

종료

2021년 11월 21일 밤 12시

주관

SW중심대학

대상

한동대 학생 누구나


문의

최경현 선생님( ) | briskly@handong.edu


2021 SW페스티벌 빅데이터 경진대회

  1. 대회명: 제3회 한동 데이터 시각화 경진대회

 

  1. 개요

우리는 한 나라의 미래가 교육에 있다는 말을 흔히 하곤 합니다. 여기 아프리카 15개 국가에서 수합된 학생별, 지역별, 국가별 교육에 관한 지표가 주어져있습니다. 본 경진대회에서는 아프리카 교육에 관한 데이터셋을 통해 나타난 개인/지역/국가별 현황을 파악하고, 이들이 당면하고 있는 문제들과 이로인해 미래에 발생하게될 문제들에 대하여 가늠하여, 효과적인 개선안/해결책을 발굴하고자 합니다.

각 참가팀은 각종 데이터 처리, 분석, 예측, 시각화 기법을 사용하여 얻어진 다양한 인사이트를 대중이 잘 이해할 수 있는 형태로 정리/표현하고, 내용을 잘 소개할 수 있는 발표를 구성하여 경합합니다. 대회를 통해 데이터 안에 숨겨진 아프리카 국가들의 더 나은 미래를 조망해볼 수 있는 기회가 되기 바랍니다.

 

  1. 데이터

    1. 링크 및 데이터

      1. 다운로드 링크: https://www.vertica.com/python/data/africa_education.csv

      2. 대회 데이터

        • COUNTRY : COUNTRY ID
          https://www.nro.net/list-of-country-codes-in-the-afrinic-region/

        • REGION : REGION ID

        • SCHOOL : SCHOOL ID

        • PUPIL : STUDENT ID

        • province : School Province

        • schoolname : School Name

        • lat : School Latitude

        • long : School Longitude

        • country_long : Country Name

        • zralocp : Student’s standardized reading score

        • zmalocp : Student’s standardized mathematics score

        • ZRALEVP : Student’s reading level

        • ZMALEVP : Student’s mathematics competency level

        • zraloct : Teacher’s standardized reading score

        • zmaloct : Teacher’s standardized mathematics score

        • ZRALEVT : Student’s reading competency level Teacher

        • ZMALEVT : Student’s mathematics competency level Teacher

        • zsdist : School average distance from clinic, road, public, library, book shop & secondary school

        • XNUMYRS : Teacher’s years of teaching

        • numstu : Number of students at each school

        • PSEX : Student’s sex

        • PNURSERY : Student preschool

        • PENGLISH : Student speaks English at home

        • PMALIVE : Student’s biological mother alive

        • PFALIVE : Student’s biological father alive

        • PTRAVEL : Travels to school

        • PTRAVEL2 : Means of transportation to school

        • PMOTHER : Mother’s education

        • PFATHER : Father’s education

        • PLIGHT : Source of lighting

        • PABSENT : Days absent

        • PREPEAT : Years repeated

        • STYPE : School type

        • SLOCAT : School location

        • SQACADEM : Academic qualifications

        • XSEX : Teacher’s sex

        • XAGE : Teacher’s age

        • XQPERMNT : Teacher’s employment status

        • XQPROFES : Teacher’s training

        • zpsibs : Student’s number of siblings

        • zpsit : Seating location

        • zpmealsc : Free school meals

        • zphmwkhl : Homework help

        • zpses : Student’s socioeconomic status

        • PAGE : Student’s Age

        • SINS2006 : School inspection

        • SPUPPR04 : Student dropout

        • SPUPPR06 : Student cheats

        • SPUPPR07 : Student uses abusive language

        • SPUPPR08 : Student vandalism

        • SPUPPR09 : Student theft

        • SPUPPR10 : Student bullies students

        • SPUPPR11 : Student bullies staff

        • SPUPPR12 : Student injures staff

        • SPUPPR13 : Student sexually harrasses students

        • SPUPPR14 : Student sexually harrasses teachers

        • SPUPPR15 : Student drug abuse

        • SPUPPR16 : Student alcohol abuse

        • SPUPPR17 : Student fights

        • STCHPR04 : Teacher bullies students

        • STCHPR05 : Teacher sexually harasses teachers

        • STCHPR06 : Teacher sexually harasses students

        • STCHPR07 : Teacher uses abusive language

        • STCHPR08 : Teacher drug abuse

        • STCHPR09 : Teacher alcohol abuse

 

  1. 분석에 추가할 수 있는 데이터셋

    1. 위에 주어진 데이터셋 외에도 다양한 오픈 데이터셋과 메쉬업을 통해 다양한 분석과 결론을 끌어내보기 바랍니다.

 

  1. 대회 데이터 출처

    1. Vertica (Badr Ouali, Head of Data Science) https://www.vertica.com/python/examples/africa_education/

 

  1. 운영 규칙

    1. 기간

      1. 참가 신청 기한: 2021년 10월 3일

      2. 출품 마감: 2021년 11월 21일 밤 12시

      3. 시상: 2021년 12월 3일

    2. 제출을 위해 따라야하는 포맷 외에, 데이터 분석 및 시각화를 위하여 사용하는 언어, 툴, 플랫폼 등에 대한 제한은 없습니다.

    3. 대회 목적 이외에 개인적으로 코드 또는 데이터를 공유하는 것은 허용하지 않습니다.

    4. 기존 대회 결과물로부터 아이디어를 도용하였을 때에 해당 출품작은 무효처리 됩니다.

 

  1. 출품 방법

    1. 시각화 결과물을 포함한 다음의 자료를 briskly@handong.edu(최경현 선생님)으로 제출

    2. 제출물

      1. 시각화 내용과 구현 과정을 소개하는 발표 동영상 (최대 10분)

      2. 시각화 내용의 재현이 가능한 코드

      3. 발표에 사용된 슬라이드 파일

 

  1. 심사 기준

    1. 목적: 아프리카 지역 국가들로부터 수합된 학생별, 지역별, 국가별 기록으로부터 개인/집단에 대한 현황을 파악하고, 당면해있는 문제들과 이에 대한 효과적인 개선안/해결책을 발굴

    2. 기준

      1. 데이터 분석 및 시각화 과정을 통해 발견한 새로운 이해를 바탕으로 올바르고 분명한 결론을 도출해 냈는지

      2. 데이터의 1차원적인 사용보다, 여러 컬럼을 동시에 활용하여 데이터가 내포하는 메세지를 충분히 발굴해 냈는지

      3. 데이터 처리 및 시각화 과정에서 데이터를 왜곡이 발생하지 않았는지

      4. 시각화 및 메세지화하고자 하는 내용을 적절한 언어/툴을 통하여 구현하였는지

      5. 담고자하는 메세지를 위해 사용한 시각화의 방법이 적절하였는지

      6. (가산점) Interactive한 요소가 제공되었는지

      7. (가산점) 제공된 데이터 외의 다른 오픈 데이터와 mashup을 통해 새로운 차원의 인사이트를 제공하였는지

    3. 대회 및 수상에 관련된 일정과 규칙은 상황에 따라서 변동이 있을 수 있습니다. 현재 문서를 지속적으로 확인하기 바랍니다.

 

  1. 시상

    1. 시상 규모 총 300만원

      1. 대상 : 1팀 60만원

      2. 최우수상 : 2팀 35만원

      3. 우수상 : 4팀 각 20만원

      4. 장려상 : 6팀 각 15만원

    2. 제출 결과가 최소 심사 기준에 미달이 될 경우 우승자를 선정하지 않을 수 있습니다.

 

  1. 힌트 (학생들이 참고할 수 있는 자료로 제공)

    1. 2020년도 2회 대회 우수작

      1. https://drive.google.com/file/d/16iRaBkfbL1V3Z8LjtMsSDmwzDKYX-ce6/view?usp=sharing

      2. https://drive.google.com/file/d/16nxTyyS5J6nCf0FN4eszc_-AskCW7_qx/view?usp=sharing

      3. https://drive.google.com/file/d/16oK9pC7uoQJqZtXyMN07aEKLH4mupo8v/view?usp=sharing

    2. 2019년도 1회 대회 우수작

      1. https://www.youtube.com/watch?v=jWKWRB14LUs

      2. https://www.youtube.com/watch?v=vJ6dBeDN9Ig

    3. Dacon 대회 우수작

      1. https://bdp.kt.co.kr/invoke/SOKBP2507/

    4. Relevant Kaggle forums

      1. https://www.kaggle.com/theworldbank/education-statistics

      2. https://www.kaggle.com/c/student-academic-performance

    5. Introduction to Data Visualization in Python https://towardsdatascience.com/introduction-to-data-visualization-in-python-89a54c97fbed

    6. Top 50 ggplot2 Visualizations – The Master List (With Full R Code) http://r-statistics.co/Top50-Ggplot2-Visualizations-MasterList-R-Code.html

    7. The 10 best data visualization blogs to follow (Tableau)
      https://www.tableau.com/learn/articles/best-data-visualization-blogs

    8. Take Advantage Of The Best Interactive & Effective Data Visualization Examples
      https://www.datapine.com/blog/best-data-visualizations/

[SW페스티벌] 한동 데이터 시각화 경진대회