본문 바로가기
[ 알고리즘 ]/알고리즘

[알고리즘] 3. BFS & DFS

by 불주먹고양이 2022. 1. 3.

/* '이것이 취업을 위한 코딩 테스트다' 책의 저자이신 나동빈 님의 예시와 제가 학교 수업에서 배운 내용을 바탕으로 정리했습니다. */

 

 

1. 그래프 탐색 알고리즘

- 탐색 (search) : 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정

- 대표적인 그래프 탐색 알고리즘으로는 DFS와 BFS가 있다.

- DFS / BFS는 코딩 테스트에서 매우 자주 등장하는 유형이므로 반드시 숙지해야 한다.

 

 

2. 스택 자료구조

- 먼저 들어 온 데이터가 나중에 나가는 형식 (선입후출 - FILO)의 자료구조

- 입구와 출구가 동일한 형태로 스택을 시각화할 수 있다.

 

 

2-*. 스택 구현

stack = []
stack.append(1)
stack.append(2)
stack.append(3)
stack.append(4)
stack.pop()
stack.pop()

print(stack)            # 들어온 순서대로 출력
print(stack[::-1])      # 나가는 순서대로 출력 (가장 최근에 입력된 순서)

< 출력 >

[1, 2]

[2, 1]

 

 

3. 큐 자료구조

- 먼저 들어 온 데이터가 먼저 나가는 형식 (선입선출 - FIFO)의 자료구조

- 입구와 출구가 모두 뚫려 있는 터널과 같은 형태로 시각화할 수 있다.

 

 

3-*. 큐 구현

from collections import deque

queue = deque()

queue.append(1)
queue.append(2)
queue.append(3)
queue.append(4)
queue.popleft()

print(queue)            # 먼저 들어온 순서대로 출력
queue.reverse()
print(queue)  # 나중에 들어온 원소부터 출력

< 출력 >

deque([2, 3, 4])
deque([4, 3, 2])

 

 

4. 재귀 함수

- 자기 자신을 다시 호출하는 함수

- 단순한 형태의 재귀 함수 예제로, '재귀함수'라는 문자열을 무한히 출력한다.

- 어느 정도 출력하다가 최대 재귀 깊이 초과 메세지가 출력된다.

- DFS 구현 시 필요한 문법이다.

 

- 재귀 함수의 종료 조건

: 재귀 함수를 문제 풀이에서 사용할 때에는 재귀 함수의 종료 조건을 반드시 명시해야 한다. 종료 조건을 명시하지 않으면 함수가 무한히 호출될 수 있다.

 

def recursive_func(i):
    if i == 10:
        return
    print(i)
    recursive_func(i+1)


recursive_func(1)

< 출력 >

1
2
3
4
5
6
7
8
9

 

 

- 팩토리얼을 재귀 함수로 구현하기

cf) 수학적으로 0!과 1!의 값은 1이다.

def factorial(n):
    if n <= 1:
        return 1
    else:
        return n * factorial(n-1)


result = factorial(5)
print(result)

< 출력 >

120

 

 

- 최대공약수 계산 (유클리드 호제법)

num1 = int(input())
num2 = int(input())


def euclid(num1, num2):

    if num1 % num2 == 0:
        return num2
    else:
        mod = num1 % num2
        return euclid(num2, mod)


if(num1 > num2):
    result = euclid(num1, num2)
else:
    result = euclid(num2, num1)

print(result)

< 출력 >

192

162

6

 

 

- 재귀 함수 사용 시 유의 사항

: 재귀 함수를 잘 활용하면 복잡한 알고리즘을 간결하게 작성할 수 있다. 단, 오히려 다른 사람이 이해하기 어려운 형태의 코드가 될 수도 있으므로 신중하게 사용해야 한다.

- 모든 재귀 함수는 반복문을 이용하여 동일한 기능을 구현할 수 있다. 재귀 함수가 반복문보다 유리한 경우도 있고, 불리한 경우도 있다.

- 컴퓨터가 함수를 연속적으로 호출하면 컴퓨터 메모리 내부의 스택 프레임에 쌓인다. 그래서 스택을 사용해야 할 때 구현상 스택 라이브러리 대신에 재귀 함수를 이용하는 경우가 많다.

 

 

 

5. DFS

- 깊이 우선 탐색

- 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘

출처 : 위키 백과

- 스택 자료구조 (혹은 재귀함수)를 이용하며, 구체적인 동작 과정은 다음과 같다.

1) 탐색 시작 노드를 스택에 삽입하고 방문 처리한다.

2) 스택의 최상단 노드에 방문하지 않은 인접한 노드가 하나라도 있으면 그 노드를 스택에 넣고 방문 처리한다.

3) 더이상 2번의 과정을 수행할 수 없을 때까지 반복한다.

 

- DFS 메서드 정의

def dfs(graph, v, visited):
    visited = True
    print(v, end='')
    
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)

일단 현재 노드를 True로 만들어서 방문 처리를 해주고 현재 노드의 연결 요소들을 하나씩 방문 하면서 깊이 탐색을 진행한다.

 

- 각 노드가 연결된 정보는 2차원 배열로 표현한다.

graph = [
    [],                 # 0번 노드의 연결 요소 : 없음
    [2, 3, 8],          # 1번 노드의 연결 요소 : 2, 3, 8번 노드
    [1, 7],             # 2번 노드의 연결 요소 : 1, 7번 노드
    [1, 4, 5],          # 3번 노드의 연결 요소 : 1, 4, 5번 노드
    [3, 5],             # 4번 노드의 연결 요소 : 3, 5번 노드
    [3, 4],             # 5번 노드의 연결 요소 : 3, 4번 노드
    [7],                # 6번 노드의 연결 요소 : 7번 노드
    [2, 6, 8],          # 7번 노드의 연결 요소 : 2, 6, 8번 노드
    [1, 7]              # 8번 노드의 연결 요소 : 1, 7번 노드
]

 

그림으로 나타내면 다음과 같다.

 

- DFS 메서드와 연결 정보를 융합하여 어떻게 사용하는 지에 대한 예시 코드는 다음과 같다.

# 각 노드가 방문된 정보를 표현 (1차원 리스트)
visited = [False]*9     # 0번 노드는 사용 안하게 일부러 9개의 원소로 만들어줌

# 정의된 DFS 함수 호출
dfs(graph, 1, visited)

※ 0번 노드는 없다고 봐도 무방하다!

 

 

 

6. BFS

- 너비 우선 탐색

- 그래프에서 가까운 노드부터 우선적으로 탐색하는 알고리즘

- 실제 기업 코딩 테스트에 자주 등장하는 문제이며, 최단 경로를 파악하는 문제에서 자주 등장한다.

출처 : 위키백과

- BFS는 큐 자료구조를 이용하며, 구체적인 동작 과정은 다음과 같다.

1) 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.

2) 큐에서 노드를 꺼낸 뒤에 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모든 큐에 삽입하고 방문 처리 한다.

3) 더 이상 2번의 과정을 수행할 수 없을 때까지 반복한다.

 

- BFS 메서드 정의

def bfs(graph, start, visited):
    queue = deque([start])
    visited[start] = True

    while queue:
        v = queue.popleft()
        print(v, end=' ')

        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True
 
 
# 각 노드가 연결된 정보를 표현 (2차원 리스트)
graph = [
    [],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

# 각 노드가 방문된 정보를 표현 (1차원 리스트)
visited = [False]*9

# 정의된 BFS 함수 호출
bfs(graph, 1, visited)

큐 자료구조를 사용하기 위해서 덱 라이브러리를 가져왔다.

현재 노드를 방문 처리하고 popleft 해준 후에,

그 노드의 연결 요소들을 하나씩 검토하면서 방문하지 않았었다면 큐에 append 해준다.

모든 연결 요소들을 다 검토했다면,

큐에 있는 다른 요소를 검토하기 시작한다.

이를 반복하여 모든 원소에 대한 visited 값이 True가 되도록 한다.

 

 

 

7. 문제 (1)

N x M 크기의 얼음 틀이 있습니다. 구멍이 뚫려 있는 부분은 0, 칸막이가 존재하는 부분은 1로 표시됩니다. 구멍이 꿇려 있는 부분끼리 상, 하, 좌, 우로 붙어 있는 경우 서로 연결되어 있는 것으로 간주합니다.
이때 얼음 틀의 모양이 주어졌을 때 생성되는 총 아이스크림의 개수를 구하는 프로그램을 작성하세요.

다음의 4 x 5 얼음 틀 예시에서는 아이스크림이 총 3개 생성됩니다.

 

- 깊이 우선 탐색을 활용해야 한다.

- 특정한 지점의 주변 상, 하, 좌, 우를 살펴본 뒤에 주변 지점 중에서 값이 0이면서 아직 방문하지 않은 지점이 있다면 해당 지점을 방문한다.

- 방문한 지점에서 다시 상, 하, 좌,우를 살펴보면서 방문을 진행하는 과정을 반복하면, 연결된 모든 지점을 방문할 수 있다

- 모든 노드에 대하여 1 ~ 2번의 과정을 반복하며, 방문하지 않은 지점의 수를 카운트한다.

 

< 정답 코드 >

N, M = map(int, input().split())
iceBox = []
count = 0

for n in range(N):
    iceBox.append(list(input()))


def iceCounting(row_i, column_j):
    if row_i < 0 or row_i >= N or column_j < 0 or column_j >= M:
        return False

    if iceBox[row_i][column_j] == '1':
        return False
    else:
        iceBox[row_i][column_j] = '1'
        iceCounting(row_i - 1, column_j)
        iceCounting(row_i + 1, column_j)
        iceCounting(row_i, column_j - 1)
        iceCounting(row_i, column_j + 1)
        return True


for i in range(N):
    for j in range(M):
        if iceCounting(i, j) == True:
            count += 1


print(count)

< 출력 >

4 5
00110
00011
11111
00000
3

 

 

 

8. 문제 (2)

동빈이는 N x M 크기의 직사각형 형태의 미로에 갇혔습니다. 미로에는 여러 마리의 괴물이 있어 이를 피해 탈출해야 합니다. 동빈이의 위치는 (1,1)이며 미로의 출구는 (N,M)의 위치에 존재하며 한 번에 한 칸씩 이동할 수 있습니다.
이때 괴물이 있는 부분은 0으로, 괴물이 없는 부분은 1로 표시되어 있다. 미로는 반드시 탈출할 수 있는 형태로 제시됩니다.

이때 동빈이가 탈출하기 위해 움직여야 하는 최소 칸의 개수를 구하세요. 칸을 셀 때는 시작 칸과 마지막 칸을 모두 포함해서 계산합니다.

 

< 내 코드 >

n, m = map(int, input().split())
maze = []
count = 0

for _ in range(n):
    maze.append(list(map(int, input())))


def maze_exit(i, j):
    global count

    if i >= n or i < 0 or j >= n or j < 0:
        return False

    if maze[i][j] == 0:
        return False
    else:
        count += 1
        maze[i][j] = 0
        maze_exit(i+1, j)
        maze_exit(i, j+1)
        return True


maze_exit(0, 0)

print(count)

나는 함수 내에서 global 변수를 사용해서 count 값을 증가시켰다.

 

< 정답 코드 >

def bfs(x, y):
    queue = deque()
    queue.append((x, y))

    while queue:
        x, y = queue.popleft()
        for i in range(4):
            nx = x + dx[i]
            ny = y + dy[i]

            # 미로 찾기 공간을 벗어난 경우 무시
            if nx < 0 or nx >= n or ny < 0 or ny >= m:
                continue

            # 벽인 경우 무시
            if graph[nx][ny] == 0:
                continue

            # 해당 노드를 처음 방문하는 경우에만 최단 거리 기록
            if graph[nx][ny] == 1:
                graph[nx][ny] = graph[x][y] + 1
                queue.append((nx, ny))

    # 가장 오른쪽 아래까지의 최단 거리 반환
    return graph[n-1][m-1]


n, m = map(int, input().split())
graph = []

for i in range(n):
    graph.append(list(map(int, input())))

dx = [-1, 1, 0, 0]
dy = [0, 0, -1, 1]

print(bfs(0, 0))

- 시작 지점에서 가까운 노드부터 차례대로 그래프의 모든 노드를 탐색한다.

- 상, 하, 좌, 우로 연결된 모든 노드로의 거리가 1로 동일하다. 따라서 (1,1) 지점에서부터 BFS를 수행하여 모든 노드의 최단거리 값을 기록하면 해결할 수 있다.

 

- 처음에 (1,1)의 위치에서 시작한다. 좌표에서 상, 하, 좌, 우로 탐색을 진행하면 바로 옆 노드인 (1,2) 위치의 노드를 방문하게 되고 새롭게 방문하는 (1,2) 노드의 값을 2로 바꾼다.

- 계속해서 BFS를 수행하면서 최단 경로의 값들이 1씩 증가하는 형태로 변경한다.