문제
평소에 문자열을 가지고 노는 것을 좋아하는 민호는 DNA 문자열을 알게 되었다. DNA 문자열은 모든 문자열에 등장하는 문자가 {‘A’, ‘C’, ‘G’, ‘T’} 인 문자열을 말한다. 예를 들어 “ACKA”는 DNA 문자열이 아니지만 “ACCA”는 DNA 문자열이다. 이런 신비한 문자열에 완전히 매료된 민호는 임의의 DNA 문자열을 만들고 만들어진 DNA 문자열의 부분문자열을 비밀번호로 사용하기로 마음먹었다.
하지만 민호는 이러한 방법에는 큰 문제가 있다는 것을 발견했다. 임의의 DNA 문자열의 부분문자열을 뽑았을 때 “AAAA”와 같이 보안에 취약한 비밀번호가 만들어 질 수 있기 때문이다. 그래서 민호는 부분문자열에서 등장하는 문자의 개수가 특정 개수 이상이여야 비밀번호로 사용할 수 있다는 규칙을 만들었다.
임의의 DNA문자열이 “AAACCTGCCAA” 이고 민호가 뽑을 부분문자열의 길이를 4라고 하자. 그리고 부분문자열에 ‘A’ 는 1개 이상, ‘C’는 1개 이상, ‘G’는 1개 이상, ‘T’는 0개 이상이 등장해야 비밀번호로 사용할 수 있다고 하자. 이때 “ACCT” 는 ‘G’ 가 1 개 이상 등장해야 한다는 조건을 만족하지 못해 비밀번호로 사용하지 못한다. 하지만 “GCCA” 은 모든 조건을 만족하기 때문에 비밀번호로 사용할 수 있다.
민호가 만든 임의의 DNA 문자열과 비밀번호로 사용할 부분분자열의 길이, 그리고 {‘A’, ‘C’, ‘G’, ‘T’} 가 각각 몇번 이상 등장해야 비밀번호로 사용할 수 있는지 순서대로 주어졌을 때 민호가 만들 수 있는 비밀번호의 종류의 수를 구하는 프로그램을 작성하자. 단 부분문자열이 등장하는 위치가 다르다면 부분문자열이 같다고 하더라도 다른 문자열로 취급한다.
입력
첫 번째 줄에 민호가 임의로 만든 DNA 문자열 길이 |S|와 비밀번호로 사용할 부분문자열의 길이 |P| 가 주어진다. (1 ≤ |P| ≤ |S| ≤ 1,000,000)
두번 째 줄에는 민호가 임의로 만든 DNA 문자열이 주어진다.
세번 째 줄에는 부분문자열에 포함되어야 할 {‘A’, ‘C’, ‘G’, ‘T’} 의 최소 개수가 공백을 구분으로 주어진다. 각각의 수는 |S| 보다 작거나 같은 음이 아닌 정수이며 총 합은 |S| 보다 작거나 같음이 보장된다.
출력
첫 번째 줄에 민호가 만들 수 있는 비밀번호의 종류의 수를 출력해라.
예제 입력 1
9 8
CCTGGATTG
2 0 1 1
예제 출력 1
0
예제 입력 2
4 2
GATA
1 0 0 1
예제 출력 2
2
sli = [0]*4 #리스트 변수를 만든다
cli = [0]*4 #리스트 변수를 만든다
cs = 0 #cs를 0으로 지정해서 값을 더해나가거나 제거해나가게 한다
def add(c):
global sli,cli,cs
if c == 'A': #만약 c가 문자A이면
cli[0] += 1 #cli[0]에다가 1을 더해나간다
if cli[0] == sli[0]: #cli[0]이 sli[0]과 같다면
cs += 1 # cs에다가 1을 더해간다
elif c == 'C': #만약 c가 문자C라면 cli[1]에다가
cli[1] += 1 #cli[1]에다가 1을 더해나간다
if cli[1] == sli[1]: #만약 cli[1]이 sli[1]과 같다면
cs += 1 #cs에다가 1을 더해나간다
elif c == 'G': #만약 c가 G라면
cli[2] += 1 # cli[2]에다가 1을 더해나간다
if cli[2] == sli[2]: #만약 cli[2]와 sli[3]이 같다면
cs += 1 # cs에다가 1씩 더해나간다
elif c == 'T': #만약 c가 T라면
cli[3] += 1 # cli[3]에다가 1을 더해나간다
if cli[3] == sli[3]: #만약 cli[3]와 sli[3]이 같다면
cs += 1 #cs에다가 1씩 더해나간다
def remove(c): #위와 설명이 같지만 c와 문자가 같으면 cli[i]에 1씩 빼고, cli[i]와 sli[i]가 같으면 cs에서 1씩 빼야된다
global sli,cli,cs
if c == 'A':
if cli[0] == sli[0]:
cs -= 1
cli[0] -= 1
if c == 'C':
if cli[1] == sli[1]:
cs -= 1
cli[1] -= 1
if c == 'G':
if cli[2] == sli[2]:
cs -= 1
cli[2] -= 1
if c == 'T':
if cli[3] == sli[3]:
cs -= 1
cli[3] -= 1
d,p = map(int,input().split()) #d와 p로 입력을 받는다
a = list(input()) #리스트를 입력받는다
need = list(map(int,input().split())) #need로 이름을 지정하고선 리스트를 숫자로 입력받기위해 map을 사용한다
count = 0 #count변수를 만들어서 값을 0으로 지정해둔다
for i in range(4): #for문을 사용하여 4번 반복시킨다
if need[i] == 0: #만약 need[i]가 숫자 0과 같다면
cs += 1 #cs에 1을 더해나간다
for i in range(p): #p만큼 반복시켜서
add(a[i]) #add함수 안에다가 a[i]를 집어넣는다
if cs == 4: #cs가 4이면 count함수에다가 1을 더해야 되기 때문에
count += 1 #count += 1을 한다
for j in range(p,d): #p부터 d까지 반복해야되기 때문에 for문의 범위를 p,d로 정한다
x = i-p #x라는 변수를 만들어서 i-p로 지정해준다
add(a[j]) # add함수 안에다가 add[i]를 집어넣는다
remove(a[i]) #a[i]를 없애기 위해서 remove함수를 사용한다
if cs == 4: #만약 cs가 4라면 count에다가 1을 더해나가야 되기 때문에
count +=1 #count += 1을 한다
print(count) #결과를 출력하기위해서 count를 출력한다
'자료구조와 알고리즘 > 투포인터 이동원칙' 카테고리의 다른 글
Python 투포인터 이동 원칙(백준 2018 수들의 합 5) (0) | 2025.03.08 |
---|