2021 SW페스티벌 빅데이터 경진대회
-
대회명: 제3회 한동 데이터 시각화 경진대회
-
개요
우리는 한 나라의 미래가 교육에 있다는 말을 흔히 하곤 합니다. 여기 아프리카 15개 국가에서 수합된 학생별, 지역별, 국가별 교육에 관한 지표가 주어져있습니다. 본 경진대회에서는 아프리카 교육에 관한 데이터셋을 통해 나타난 개인/지역/국가별 현황을 파악하고, 이들이 당면하고 있는 문제들과 이로인해 미래에 발생하게될 문제들에 대하여 가늠하여, 효과적인 개선안/해결책을 발굴하고자 합니다.
각 참가팀은 각종 데이터 처리, 분석, 예측, 시각화 기법을 사용하여 얻어진 다양한 인사이트를 대중이 잘 이해할 수 있는 형태로 정리/표현하고, 내용을 잘 소개할 수 있는 발표를 구성하여 경합합니다. 대회를 통해 데이터 안에 숨겨진 아프리카 국가들의 더 나은 미래를 조망해볼 수 있는 기회가 되기 바랍니다.
-
데이터
-
링크 및 데이터
-
다운로드 링크: https://www.vertica.com/python/data/africa_education.csv
-
대회 데이터
-
COUNTRY : COUNTRY ID
https://www.nro.net/list-of-country-codes-in-the-afrinic-region/ -
REGION : REGION ID
-
SCHOOL : SCHOOL ID
-
PUPIL : STUDENT ID
-
province : School Province
-
schoolname : School Name
-
lat : School Latitude
-
long : School Longitude
-
country_long : Country Name
-
zralocp : Student’s standardized reading score
-
zmalocp : Student’s standardized mathematics score
-
ZRALEVP : Student’s reading level
-
ZMALEVP : Student’s mathematics competency level
-
zraloct : Teacher’s standardized reading score
-
zmaloct : Teacher’s standardized mathematics score
-
ZRALEVT : Student’s reading competency level Teacher
-
ZMALEVT : Student’s mathematics competency level Teacher
-
zsdist : School average distance from clinic, road, public, library, book shop & secondary school
-
XNUMYRS : Teacher’s years of teaching
-
numstu : Number of students at each school
-
PSEX : Student’s sex
-
PNURSERY : Student preschool
-
PENGLISH : Student speaks English at home
-
PMALIVE : Student’s biological mother alive
-
PFALIVE : Student’s biological father alive
-
PTRAVEL : Travels to school
-
PTRAVEL2 : Means of transportation to school
-
PMOTHER : Mother’s education
-
PFATHER : Father’s education
-
PLIGHT : Source of lighting
-
PABSENT : Days absent
-
PREPEAT : Years repeated
-
STYPE : School type
-
SLOCAT : School location
-
SQACADEM : Academic qualifications
-
XSEX : Teacher’s sex
-
XAGE : Teacher’s age
-
XQPERMNT : Teacher’s employment status
-
XQPROFES : Teacher’s training
-
zpsibs : Student’s number of siblings
-
zpsit : Seating location
-
zpmealsc : Free school meals
-
zphmwkhl : Homework help
-
zpses : Student’s socioeconomic status
-
PAGE : Student’s Age
-
SINS2006 : School inspection
-
SPUPPR04 : Student dropout
-
SPUPPR06 : Student cheats
-
SPUPPR07 : Student uses abusive language
-
SPUPPR08 : Student vandalism
-
SPUPPR09 : Student theft
-
SPUPPR10 : Student bullies students
-
SPUPPR11 : Student bullies staff
-
SPUPPR12 : Student injures staff
-
SPUPPR13 : Student sexually harrasses students
-
SPUPPR14 : Student sexually harrasses teachers
-
SPUPPR15 : Student drug abuse
-
SPUPPR16 : Student alcohol abuse
-
SPUPPR17 : Student fights
-
STCHPR04 : Teacher bullies students
-
STCHPR05 : Teacher sexually harasses teachers
-
STCHPR06 : Teacher sexually harasses students
-
STCHPR07 : Teacher uses abusive language
-
STCHPR08 : Teacher drug abuse
-
STCHPR09 : Teacher alcohol abuse
-
-
-
-
분석에 추가할 수 있는 데이터셋
-
위에 주어진 데이터셋 외에도 다양한 오픈 데이터셋과 메쉬업을 통해 다양한 분석과 결론을 끌어내보기 바랍니다.
-
-
대회 데이터 출처
-
Vertica (Badr Ouali, Head of Data Science) https://www.vertica.com/python/examples/africa_education/
-
-
운영 규칙
-
기간
-
참가 신청 기한: 2021년 10월 3일
-
출품 마감: 2021년 11월 21일 밤 12시
-
시상: 2021년 12월 3일
-
-
제출을 위해 따라야하는 포맷 외에, 데이터 분석 및 시각화를 위하여 사용하는 언어, 툴, 플랫폼 등에 대한 제한은 없습니다.
-
대회 목적 이외에 개인적으로 코드 또는 데이터를 공유하는 것은 허용하지 않습니다.
-
기존 대회 결과물로부터 아이디어를 도용하였을 때에 해당 출품작은 무효처리 됩니다.
-
-
출품 방법
-
시각화 결과물을 포함한 다음의 자료를 briskly@handong.edu(최경현 선생님)으로 제출
-
제출물
-
시각화 내용과 구현 과정을 소개하는 발표 동영상 (최대 10분)
-
시각화 내용의 재현이 가능한 코드
-
발표에 사용된 슬라이드 파일
-
-
-
심사 기준
-
목적: 아프리카 지역 국가들로부터 수합된 학생별, 지역별, 국가별 기록으로부터 개인/집단에 대한 현황을 파악하고, 당면해있는 문제들과 이에 대한 효과적인 개선안/해결책을 발굴
-
기준
-
데이터 분석 및 시각화 과정을 통해 발견한 새로운 이해를 바탕으로 올바르고 분명한 결론을 도출해 냈는지
-
데이터의 1차원적인 사용보다, 여러 컬럼을 동시에 활용하여 데이터가 내포하는 메세지를 충분히 발굴해 냈는지
-
데이터 처리 및 시각화 과정에서 데이터를 왜곡이 발생하지 않았는지
-
시각화 및 메세지화하고자 하는 내용을 적절한 언어/툴을 통하여 구현하였는지
-
담고자하는 메세지를 위해 사용한 시각화의 방법이 적절하였는지
-
(가산점) Interactive한 요소가 제공되었는지
-
(가산점) 제공된 데이터 외의 다른 오픈 데이터와 mashup을 통해 새로운 차원의 인사이트를 제공하였는지
-
-
대회 및 수상에 관련된 일정과 규칙은 상황에 따라서 변동이 있을 수 있습니다. 현재 문서를 지속적으로 확인하기 바랍니다.
-
-
시상
-
시상 규모 총 300만원
-
대상 : 1팀 60만원
-
최우수상 : 2팀 35만원
-
우수상 : 4팀 각 20만원
-
장려상 : 6팀 각 15만원
-
-
제출 결과가 최소 심사 기준에 미달이 될 경우 우승자를 선정하지 않을 수 있습니다.
-
-
힌트 (학생들이 참고할 수 있는 자료로 제공)
-
2020년도 2회 대회 우수작
-
2019년도 1회 대회 우수작
-
Dacon 대회 우수작
-
Relevant Kaggle forums
-
Introduction to Data Visualization in Python https://towardsdatascience.com/introduction-to-data-visualization-in-python-89a54c97fbed
-
Top 50 ggplot2 Visualizations – The Master List (With Full R Code) http://r-statistics.co/Top50-Ggplot2-Visualizations-MasterList-R-Code.html
-
The 10 best data visualization blogs to follow (Tableau)
https://www.tableau.com/learn/articles/best-data-visualization-blogs -
Take Advantage Of The Best Interactive & Effective Data Visualization Examples
https://www.datapine.com/blog/best-data-visualizations/
-