[Python][프로그래머스] 17676_[1차] 추석 트래픽
2018 KAKAO BLIND RECRUITMENT
https://programmers.co.kr/learn/courses/30/lessons/17676
문제 설명
추석 트래픽
이번 추석에도 시스템 장애가 없는 명절을 보내고 싶은 어피치는 서버를 증설해야 할지 고민이다. 장애 대비용 서버 증설 여부를 결정하기 위해 작년 추석 기간인 9월 15일 로그 데이터를 분석한 후 초당 최대 처리량을 계산해보기로 했다. 초당 최대 처리량은 요청의 응답 완료 여부에 관계없이 임의 시간부터 1초(=1,000밀리초)간 처리하는 요청의 최대 개수를 의미한다.
입력 형식
- solution 함수에 전달되는 lines 배열은 N(1 ≦ N ≦ 2,000)개의 로그 문자열로 되어 있으며, 각 로그 문자열마다 요청에 대한 응답완료시간 S와 처리시간 T가 공백으로 구분되어 있다.
- 응답완료시간 S는 작년 추석인 2016년 9월 15일만 포함하여 고정 길이 2016-09-15 hh:mm:ss.sss 형식으로 되어 있다.
- 처리시간 T는 0.1s, 0.312s, 2s 와 같이 최대 소수점 셋째 자리까지 기록하며 뒤에는 초 단위를 의미하는 s로 끝난다.
- 예를 들어, 로그 문자열 2016-09-15 03:10:33.020 0.011s은 "2016년 9월 15일 오전 3시 10분 33.010초"부터 "2016년 9월 15일 오전 3시 10분 33.020초"까지 "0.011초" 동안 처리된 요청을 의미한다. (처리시간은 시작시간과 끝시간을 포함)
- 서버에는 타임아웃이 3초로 적용되어 있기 때문에 처리시간은 0.001 ≦ T ≦ 3.000이다.
- lines 배열은 응답완료시간 S를 기준으로 오름차순 정렬되어 있다.
출력 형식
- solution 함수에서는 로그 데이터 lines 배열에 대해 초당 최대 처리량을 리턴한다.
입출력 예제
예제1
- 입력: [
"2016-09-15 01:00:04.001 2.0s",
"2016-09-15 01:00:07.000 2s"
] - 출력: 1
예제2
- 입력: [
"2016-09-15 01:00:04.002 2.0s",
"2016-09-15 01:00:07.000 2s"
] - 출력: 2
- 설명: 처리시간은 시작시간과 끝시간을 포함하므로
첫 번째 로그는 01:00:02.003 ~ 01:00:04.002에서 2초 동안 처리되었으며,
두 번째 로그는 01:00:05.001 ~ 01:00:07.000에서 2초 동안 처리된다.
따라서, 첫 번째 로그가 끝나는 시점과 두 번째 로그가 시작하는 시점의 구간인 01:00:04.002 ~ 01:00:05.001 1초 동안 최대 2개가 된다.
예제3
- 입력: [
"2016-09-15 20:59:57.421 0.351s",
"2016-09-15 20:59:58.233 1.181s",
"2016-09-15 20:59:58.299 0.8s",
"2016-09-15 20:59:58.688 1.041s",
"2016-09-15 20:59:59.591 1.412s",
"2016-09-15 21:00:00.464 1.466s",
"2016-09-15 21:00:00.741 1.581s",
"2016-09-15 21:00:00.748 2.31s",
"2016-09-15 21:00:00.966 0.381s",
"2016-09-15 21:00:02.066 2.62s"
] - 출력: 7
- 설명: 아래 타임라인 그림에서 빨간색으로 표시된 1초 각 구간의 처리량을 구해보면 (1)은 4개, (2)는 7개, (3)는 2개임을 알 수 있다. 따라서 초당 최대 처리량은 7이 되며, 동일한 최대 처리량을 갖는 1초 구간은 여러 개 존재할 수 있으므로 이 문제에서는 구간이 아닌 개수만 출력한다.
간단히 설명하자면,
a1~a2 시간동안 1건의 log처리가 이루어지고 이 리스트가 주어졌을 때, 동시에 가장 많은 log처리가 이루어지고 있는 1초 구간에서 max log처리 cnt를 구하는 문제이다. 완전탐색(Brute Force)로 풀이하였다.
위에 그림과 같이 1초 동안 가장 많은 log가 처리되고 있는 구간을 찾아야하는데, 0.001 ms 단위로 다 구해보는것은 타임오버가 발생할텐데 그러면 어떻게 구간을 탐색하는 것이 좋을까?
--> 각 로그 작업의 start시간, end시간을 배열에 저장하고, 각각의 end시간부터 1초를 구간으로 탐색한다.
그러면 이 구간에 속하는 다른 처리되고 있는 작업은 start가 이 구간의 종료보다 빠르고, end가 이 구간의 종료보다 늦어야 한다.
--> 이 조건을 만족하면 cnt를 증가
# time[0] 진행중 작업을 확인하려는 구간의 시작점.
# --> 즉 구간은 time[0]에서 time[0] + 0.999 까지
# 모든 작업을 순회하면서 구간에 포함되는지 확인
# time2[0] 확인 작업의 종료시간, time2[1] 확인 작업의 시작시간
if time2[0] >= time[0] and time2[1] < time[0] + 1:
cnt+=1
def solution(lines):
times, maxCnt = [], 0
for line in lines:
l = line.split()
hh,mm,ss = l[1].split(':')
end = int(hh)*60*60 + int(mm)*60 + float(ss)
sta = end - float(l[2][0:-1]) + 0.001
times.append([end, sta])
times = sorted(times)
# end+1 보다 빨리 시작 하고, end보다는 늦게 끝나는 log처리를 cnt
# print(times)
for time in times:
cnt = 0
for time2 in times:
if time2[0] >= time[0] and time2[1] < time[0] + 1:
cnt+=1
maxCnt = max(maxCnt, cnt)
return maxCnt
이 풀이에서 3번 테스트케이스가 자꾸 틀렸는데,
1초구간이라고 하면 00:00:00.000 ~ 00:00:00.999 이기 때문이라고 한다.
이 부분을 신경써서 조건을 잘 세우자.