없는 문제는 노력과 지능의 문제로 못풀거나 일부만 풀어 작성했습니다.

 

1. 다음과 같이 결측값이 포함된 데이터셋 ds를 생선한 후, 다음 문제를 해결하기 위한 R 코드를 작성하시오.

ds <- state.x77
ds[2,3] <- NA; ds[3,1] <- NA; ds[2,4] <- NA; ds[4,3] <- NA

 

3. R에서 제공하는 airquality 데이터셋에 대해 다음의 문제를 해결하기 위한 R 코드를 작성하시오.

 

4. R에서 제공하는 state.x77 데이터셋에 대하여 다음 문제를 해결하기 위한 R 코드를 작성하시오.

 

1. R에서 제공하는 cars 데이터셋을 이용하여 speed와 dist 에 대한 산점도를 작성하고, 두 변수 간의 상관 관계를 설명하시오(x축 : speed, y축 : dist)

speed 가 증가할수록 dist 도 증가한다.

 

2. R에서 제공하는 pressure 데이터셋을 이용해 temperature 와 pressure 에 대한 산점도를 작성하고, 두 변수 간의 상관 관계를 설명하시오(x축 : temperature, y축 : pressure)

temperature 가 증가할수록 pressure 가 증가한다. 특정 지점에서 급진적으로 증가한다.

 

3. R에서 제공하는 state.x77 데이터셋에서 Population, Income, Illiteracy, Area 변수 간 산점도를 작성하고, 상관 관계를 관찰하시오.

전체적으로 선형을 띄는 산점도가 없다. 상관 관계가 별로 없다.

 

4. R에서 제공하는 iris 데이터셋에서 Species 정보에 따른 Sepal.Length 와 Sepal.Width 의 분포에 대해 산점도를 통해 알아보시오.

꽃마다 정도는 다르지만 전체적으로 Sepal.Length가 증가하면 Sepal.Width 도 증가한다.

 

5. 다음은 직장인 10명의 수입과 교육받은 기간을 조사한 자료이다. 산점도와 상관계수를 구하고, 수입과 교육기간 사이에 어떤 상관 관계가 있는지 설명하시오.

교육기간이 증가할 수록 수입이 증가한다. 상관계수가 0.8236323 이므로 상관관계가 높다고 본다.

 

6. 다음은 대학생 10명의 성적과 주당 TV 시청시간을 조사한 자료이다. 산점도와 상관계수를 구하고, 성적과 TV 시청시간 사이에 어떤 상관 관계가 있는지 설명하시오.

상관계수는 -0.6283671 으로 -0.5보다 높으므로 상관계수가 높다고 볼 수 있다.

Tv시청시간이 증가할수록 점수가 낮아진다.

 

7. R에서 제공하는 mtcars 데이터셋에서 mpg와 다른 변수들 간의 상관계수를 구하시오. 어느 변수가 mpg와 가장 상관성이 높은지 산점도와 함께 설명하시오.

상관계수의 절대 값이 가장높은 wt가 mpg 와 가장 상관성이 높다.

 

8. 다음은 2015년부터 2026년도까지의 예상 인구수 추계자료이다. 연도를 x축으로 하여 선그래프를 작성하시오.

 

9. 다음은 2014년 4분기부터 2017년 3분기까지 남녀 경제활동참가율을 나타낸 통계자료이다. 연도를 x축으로 하고 남녀를 각각 다른 선과 색으로 표시하는 그래프를 작성하시오.(2014년 4분기는 20144, 2015년 1분기는 20151과 같은 형식으로 입력)

 

10. R에서 제공하는 trees 데이터셋에 대해 다은 문제를 해결하기 위한 R 코드를 작성하시오.

 

11. R에서 제공하는 Orange 데이터셋에서 나무의 age 와 circumference 에 대해 산점도를 그룹 번호별로 점의 색을 달리하여 작성하시오.

 

12. mlbench 패키지에서 제공하는 Glass 데이터셋에 대해 다음의 문제를 해결하가 위한 R 코드를 작성하시오.

 

스크립트

결과

나머지 생략

 

14. R에서 제공하는 LakeHuron 데이터셋은 호수의 연도별 평균 수위 정보가 저장되어 있다. 다음과 같이 연도(years)와 수위(hlevel) 벡터를 생성한 후 연도를 x 축으로 하여 선그래프를 작성하시오.

 

스크립트

결과

 

15. R에서 제공하는 AirPassengers 데이터셋은 1949년~1960년 사이의 항공승객수를 월별로 나타낸 것이다. AirPassengers 데이터셋에서 1949, 1955, 1960년의 월별 승객수를 선그래프로 작성하는데, 3개년도의 선의 색을 다르게 하시오.

 

스크립트

결과

16생략

1. R에서 제공하는 infert 데이터셋에 대해 다음 문제를 해결하기 위한 R 코드를 작성하시오.

(1)

(2)

(3)

(4)

barplot(table(edu)/length(edu))

 

2. 어떤 학급의 성별이 다음과 같을 때 주어진 문제를 해결하기 위한 R 코드를 작성하시오.

F F F M M F F F M M

 

스크립트

결과

 

3. 좋아하는 계절에 대한 조사 결과가 다음과 같을 때 주어진 문제를 해결하기 위한 R 코드를 작성하시오

여름 겨울 가을 여름 가을 겨울 여름 여름 가을

스크립트

결과

한글오류가 났다
한글이 깨졌다

 

 

4. 학생 A의 과목별 성적이 다음과 같을 때 각 문제를 해결하기 위한 R 코드를 작성하시오.

KOR ENG ATH HIST SOC MUSIC BIO EARTH PHY ART
90 85 73 80 85 65 78 50 68 96

스크립트

결과

 

5. R에서 제공하는 mtcars 데이터셋에 대해 다음 문제를 해결하기 위한 R코드를 작성하시오.

스크립트

결과

6, 7 번 생략

1. 다음의 각 문제를 해결하기 위한 R 코드를 작성하시오.

(1) 1~100 사이의 정수 중 3의 배수들의합과 개수를 구하시오.

(2) 101~200 사이의 숫자 중 3과 4의 공배수를 출력하시오.

(3) 24의 약수를 출력하시오.

(4) 10!을 출력하시오.(단, factorial() 함수를 이용하지 않는다.)



2. for문을 이용하여 구구단 중 9단을 출력하는 R 코드를 작성하시오.




3. while문을 이용하여 구구단 중 8단을 출력하는 R코드를 작성하시오.

 

4. 1~100의 정수를 차례를 출력하되 3의 배수에서는 숫자 대신 '*'을 출력하는 R 코드를 작성하시오.(출력은 가로 방향으로 한다.)

 

 

 

 

 

 

 

 

 

5. 소수(prime number)는 1과 자기 자신 외에는 나누어 떨어지지 않는 수를 말한다. 2~1000 사이의 소수를 출력하는 R 코

드를 작성하시오.




6. 0, 1, 1, 2, 3, 5, 8, 13, 21 ... 형태의 수열, 즉 첫 번째 항의 값은 0이고 두 번째 항의 값은 1일 때 이후의 항들은 이전의 두 항을 더한 값으로 만들어지는 수열을 '피보나치 수열'이라고 한다. 0에서부터 시작하여 40개의 피보나치 수열을 출력하는 R 코드를 작성하시오.



7. R의 apply() 함수를 이용하여 다음 문제를 해결하는 R 코드를 작성하시오.



8. R의 apply() 함수를 이용하여 다음 문제를 해결하는 R 코드를 작성하시오.





9. 다음과 같이 두 정수를 입력하면 두 수의 최대공약수를 찾아서 반환(return)하는 R 함수 lgm()을 만들고 테스트하시오.


10. 다음과 같이 벡터를 입력하면 벡터의 최댓값과 최솟값을 반환(return)하는 R 함수 maxmin()을 만들고 테스트하시오.(반환값이 list임).


11. 10명의 몸무게를 저장한 벡터가 다음과 같을 때 질문을 해결하기 위한 R 코드를 작성하시오.

weight <- c(69, 50, 55, 71, 89, 64, 59, 70, 71, 80)


12. 다음의 문제를 해결하기 위한 R 코드를 작성하시오.(which() 함수 사용.)

 

한빛아카데미 모두를 위한 R 데이터 분석 입문

본 연습문제들은 작성자 본인이 푼것이라 틀릴 수 도 있습니다.

 

1. R을 이용하여 각 문제를 수행하기 위한 코드를 작성하시오.

> score
        m    f
[1,]  10  21
[2,] 40 60
[3,] 60 70
[4,] 20 30

 

2. R에서 제공하는 state.x77 데이터셋을 이용하여 코드를 작성하시오.

 

3. R에서 제공하는 mtcars 데이터셋은 자동차 모델에 대한 제원 정보를 담고 있다. 이 데이터셋에 대해서 다음 문제를 해결하기 위한 코드를 작성하시오.

4. R에서 제공하는 airquality 데이터셋은 일별로 대기의 질을 측정한 자료를 포함하고 있다. 이 데이터셋에 대해서 다음 문제를 해결하기 위한 코드를 작성하시오.

 

5. R에서 제공하는 swiss 데이터셋은 스위스 47개 주의 경제 자료를 포함하고 있다. 이 데이터셋에 대해서 다음 문제를 해결하기 위한 코드를 작성하시오.

 

6. R을 이용하여 각 문제를 수행하기 위한 코드를 작성하시오.

 

한빛아카데미 모두를 위한 R 데이터 분석 입문

본 연습문제들은 작성자 본인이 푼것이라 틀릴 수 도 있습니다.

 

 

1. R을 이용하여 다음 계산식의 코드를 작성하고 답을 구하시오.

 

2. R을 이용하여 다음의 내용을 코드로 작성하고 답을 구하시오.

변수 a와 b에 각각 4와 5를 저장한 후 a+b의 결과를 c에 저장하고 c의 내용을 출력한다.

 

3. R을 이용하여 다음의 내용을 코드로 작성하고 답을 구하시오.

변수 pi에 3.14를 저장한 후 pi를 이용하여 반지름이 10, 12, 15인 원의 면적을 각각 구한다.

 

4. R을 이용하여 다음의 내용을 코드로 작성하고 답을 구하시오.

y=2x^2+5x+10에 대해 x가 각각 6, 8, 10일 때 y의 값을 각각 구한다.

 

5. 다음의 R 코드의 문제점을 지적하고 어떻게 해결해야 하는지 설명하시오.

val.a <- 10
sum.ab <- val.a + val.b

val.b 값을 지정해줘야 한다.

 

6. 95, 86, 47, 55, 68로 구성된 벡터 vc.1을 생성하고 vc.1의 내용을 출력하는 코드를 작성하시오.

 

7. 100 ~ 200 사이의 짝수로 구성된 벡터 vc.2를 생성하고 vc.2의 내용을 출력하는 코드를 작성하시오.

 

8. 20개의 TRUE로 구성된 vc.3을 생성하고 vc.3의 내용을 출력하는 코드를 작성하시오.(rep 함수 사용)

 

9. 100에서 200으로 구성된 벡터 d를 생성한 다음 각 문제를 수행하는 코드를 작성하고 답을 구하시오.

 

10. 월별 결석생 수 통계가 다음과 같을 때 이 자료를 absent 벡터에 저장하시오(결석생 수를 값으로 하고, 월 이름을 값의 이름으로 한다).

JAN FEB MAR  APR MAY JUN JUL AUG SEP
결석생 수 10 8 14 15 9 10 15 12 9
OCT NOV DEC
7 8 7

 

11. 벡터 d1, d2가 다음과 같을 때 각 문제를 수행하기 위한 코드를 작성하고 답을 구하시오.

d1 <- 1:50
d2 <-51:100

 

12. 다음과 같이 벡터 v1을 생성한 다음 각 문제를 수행하기 위한 코드를 작성하고 답을 구하시오(문제를 풀다 보면 v1의 내용이 변경되기도 하는데, 모든 문제는 최초의 v1을 대상으로 하여 해결할 것).

 

한빛아카데미 모두를 위한 R 데이터 분석 입문

본 연습문제들은 작성자 본인이 푼것이라 틀릴 수 도 있습니다.

 

 

1. 다음 중 4차 산업혁명과 관련된 기술과 가장 거리가 먼 것은?

반도체

 

2. 다음 중 빅데이터에 대한 설명으로 가장거리가 먼 것은?

빅데이터가 주목을 받는 이유는 빅데이터를 활용하여 부가 가치를 창출하거나 풀기 어려웠던 현실 문제를 해결한 성공 사례가 늘고 있기 때문이다

 

3. 데이터 분석 과정을 순서대로 적으시오.

문제 정의 및 계획 - 데이터 수집 - 데이터 정제 및 전처리 - 데이터 탐색- 데이터 분석 - 결과 보고

 

4. R에서 함수들을 기능별로 묶어서 제공하는 것을 ( 패키지 ) 라고 한다. 어떤 함수를 이용하기 위해서는 일반적으로 그 함수가 포함된 ( 패키지 ) 를 library() 함수를 통해 불러와야한다.

 

5. R 스튜디오 에서 커서가 위치한 줄의 명령문을 실행하기 위한 단축키를 고르시오.

Ctrl + Enter

+ Recent posts