最終更新 1756818083

修正履歴 d3f4c61f1a84265372b8dea38d1956a5ae920cc2

shp2pgsql_local.sh Raw
1#!/bin/bash
2
3DB="yourDb" # 실제 데이터베이스 이름으로 변경
4USER="postgres" # 실제 PostgreSQL 사용자명으로 변경
5SCHEMA="yourSchema" # 스키마 이름
6TABLE="yourTable" # 생성할 테이블 이름
7
8# 대소문자 구분 문제 해결을 위해 소문자로 변환
9SCHEMA_LOWER=$(echo "$SCHEMA" | tr '[:upper:]' '[:lower:]')
10TABLE_LOWER=$(echo "$TABLE" | tr '[:upper:]' '[:lower:]')
11
12SRID_ORI=5186 # 원본 좌표계
13SRID_NEW=0 # 변환 좌표계 (0이면 좌표변환 안함)
14CHARSET="UTF-8" # 문자 인코딩
15
16SHP_DIR="./" # shp 파일들이 있는 디렉토리 경로
17MAX_JOBS=8 # 병렬 작업 수 (시스템 성능에 따라 조정)
18
19# 로그 파일 설정
20LOG_DIR="./" # 로그 디렉토리 (필요시 경로 변경)
21mkdir -p "$LOG_DIR" # 로그 디렉토리가 없으면 생성
22LOG_FILE="$LOG_DIR/shp_import_$(date '+%Y%m%d_%H%M%S').log"
23
24# 로그 함수 정의
25logger() {
26 echo "[$(date '+%Y-%m-%d %H:%M:%S')] $1" | tee -a "$LOG_FILE"
27}
28
29# 시작 시간 기록
30START_TIME=$(date '+%Y-%m-%d %H:%M:%S')
31START_TIMESTAMP=$(date +%s)
32
33
34# SHP 디렉토리 및 파일 존재 확인
35if [ ! -d "$SHP_DIR" ]; then
36 logger "❌ 오류: SHP 디렉토리가 존재하지 않습니다: $SHP_DIR"
37 exit 1
38fi
39
40SHP_COUNT=$(find "$SHP_DIR" -name "*.shp" | wc -l)
41if [ $SHP_COUNT -eq 0 ]; then
42 logger "❌ 오류: SHP 파일이 없습니다: $SHP_DIR"
43 exit 1
44fi
45logger "📁 발견된 SHP 파일 수: $SHP_COUNT개"
46
47# 필수 변수 검증
48if [ -z "$DB" ]; then
49 logger "❌ 오류: DB 변수가 설정되지 않았습니다. 스크립트 상단에서 DB 변수를 설정해주세요."
50 exit 1
51fi
52
53if [ -z "$TABLE" ]; then
54 logger "❌ 오류: TABLE 변수가 설정되지 않았습니다. 스크립트 상단에서 TABLE 변수를 설정해주세요."
55 exit 1
56fi
57
58logger "📋 설정된 변수:"
59logger " - 데이터베이스: $DB"
60logger " - 사용자: $USER"
61logger " - 스키마: $SCHEMA"
62logger " - 테이블: $TABLE"
63
64# PostgreSQL 연결 테스트
65if ! psql -U "$USER" -d "$DB" -c "SELECT 1;" >/dev/null 2>&1; then
66 logger "❌ 오류: PostgreSQL 연결 실패. 데이터베이스 연결을 확인해주세요."
67 exit 1
68fi
69logger "✅ PostgreSQL 연결 성공"
70
71# 좌표계 설정 확인 및 로깅
72if [ "$SRID_NEW" -ne 0 ]; then
73 logger "🗺️ 좌표변환 모드: $SRID_ORI$SRID_NEW"
74else
75 logger "🗺️ 원본좌표계 사용: $SRID_ORI"
76fi
77
78logger "=================================="
79logger "🚀 Import 시작: $START_TIME"
80logger "=================================="
81
82# 테이블 존재 여부 확인
83logger "🔍 테이블 존재 여부 확인 중: $SCHEMA_LOWER.$TABLE_LOWER"
84
85# 테이블 존재 여부를 더 안정적으로 확인 (소문자로 비교)
86TABLE_EXISTS=$(psql -U "$USER" -d "$DB" -t -c "SELECT EXISTS (SELECT 1 FROM information_schema.tables WHERE table_schema = '$SCHEMA_LOWER' AND table_name = '$TABLE_LOWER');" 2>/dev/null | xargs)
87
88logger "🔍 테이블 존재 확인 결과: '$TABLE_EXISTS'"
89
90# 모든 SHP 파일을 배열로 수집
91SHP_FILES=($(find "$SHP_DIR" -name "*.shp" | sort))
92TOTAL_FILES=${#SHP_FILES[@]}
93
94if [ "$TABLE_EXISTS" = "t" ]; then
95 logger "📋 테이블 $SCHEMA_LOWER.$TABLE_LOWER이 이미 존재합니다. Append 모드로 진행합니다."
96 logger "🔄 총 $TOTAL_FILES개 파일을 append 모드로 처리합니다..."
97
98 # 모든 파일을 append 모드로 처리
99 for shp in "${SHP_FILES[@]}"; do
100 wait_for_jobs
101 import_append "$shp" &
102 done
103 wait
104else
105 logger "📋 테이블 $SCHEMA_LOWER.$TABLE_LOWER이 존재하지 않습니다. 새로 생성합니다."
106 logger "🔄 총 $TOTAL_FILES개 파일을 처리합니다..."
107
108 # 첫 번째 파일로 테이블 생성
109 FIRST_FILE="${SHP_FILES[0]}"
110 FIRST_BASENAME=$(basename "$FIRST_FILE")
111
112 # 테이블 생성 시작 시간 기록
113 TABLE_START_TIME=$(date '+%Y-%m-%d %H:%M:%S')
114 TABLE_START_TIMESTAMP=$(date +%s)
115
116 logger "🚀 [시작] 테이블 생성 시작: $FIRST_BASENAME - $TABLE_START_TIME"
117
118 # 좌표변환 여부에 따라 shp2pgsql 명령어 결정
119 if [ "$SRID_NEW" -ne 0 ]; then
120 OUTPUT=$(shp2pgsql -W "$CHARSET" -s $SRID_ORI:$SRID_NEW "$FIRST_FILE" $SCHEMA_LOWER.$TABLE_LOWER | psql -U "$USER" -d "$DB" 2>&1)
121 else
122 OUTPUT=$(shp2pgsql -W "$CHARSET" -s $SRID_ORI "$FIRST_FILE" $SCHEMA_LOWER.$TABLE_LOWER | psql -U "$USER" -d "$DB" 2>&1)
123 fi
124 EXIT_CODE=$?
125
126 # 테이블 생성 종료 시간 기록
127 TABLE_END_TIME=$(date '+%Y-%m-%d %H:%M:%S')
128 TABLE_END_TIMESTAMP=$(date +%s)
129 TABLE_DURATION=$((TABLE_END_TIMESTAMP - TABLE_START_TIMESTAMP))
130
131 # 테이블 생성 소요시간을 시:분:초 형식으로 변환
132 TABLE_HOURS=$((TABLE_DURATION / 3600))
133 TABLE_MINUTES=$(((TABLE_DURATION % 3600) / 60))
134 TABLE_SECONDS=$((TABLE_DURATION % 60))
135
136 # 1보다 작으면 0으로 표시
137 if [ $TABLE_HOURS -lt 1 ]; then TABLE_HOURS=0; fi
138 if [ $TABLE_MINUTES -lt 1 ]; then TABLE_MINUTES=0; fi
139
140 if [ $EXIT_CODE -eq 0 ]; then
141 logger "✅ [완료] 테이블 생성 완료: $TABLE_END_TIME (소요: ${TABLE_HOURS}시간 ${TABLE_MINUTES}${TABLE_SECONDS}초)"
142
143 # 나머지 파일들을 append 모드로 처리
144 if [ $TOTAL_FILES -gt 1 ]; then
145 logger "🔄 나머지 $((TOTAL_FILES - 1))개 파일을 append 모드로 처리합니다..."
146 for ((i=1; i<TOTAL_FILES; i++)); do
147 shp="${SHP_FILES[i]}"
148 wait_for_jobs
149 import_append "$shp" &
150 done
151 wait
152 fi
153 else
154 logger "❌ [실패] 테이블 생성 실패: $TABLE_END_TIME (소요: ${TABLE_HOURS}시간 ${TABLE_MINUTES}${TABLE_SECONDS}초)"
155 echo "$OUTPUT" >> "$LOG_FILE"
156 exit 1
157 fi
158fi
159
160# 2. 병렬로 나머지 파일 append (shp2pgsql -a)
161function import_append() {
162 SHP="$1"
163 BASENAME=$(basename "$SHP")
164
165 # 처리 시작 시간 기록
166 FILE_START_TIME=$(date '+%Y-%m-%d %H:%M:%S')
167 FILE_START_TIMESTAMP=$(date +%s)
168
169 logger "🚀 [시작] $BASENAME 처리 시작: $FILE_START_TIME"
170
171 # 좌표변환 여부에 따라 shp2pgsql 명령어 결정
172 if [ "$SRID_NEW" -ne 0 ]; then
173 OUTPUT=$(shp2pgsql -W "$CHARSET" -s $SRID_ORI:$SRID_NEW -a "$SHP" $SCHEMA_LOWER.$TABLE_LOWER | psql -U "$USER" -d "$DB" 2>&1)
174 else
175 OUTPUT=$(shp2pgsql -W "$CHARSET" -s $SRID_ORI -a "$SHP" $SCHEMA_LOWER.$TABLE_LOWER | psql -U "$USER" -d "$DB" 2>&1)
176 fi
177 EXIT_CODE=$?
178
179 # 처리 종료 시간 기록
180 FILE_END_TIME=$(date '+%Y-%m-%d %H:%M:%S')
181 FILE_END_TIMESTAMP=$(date +%s)
182 FILE_DURATION=$((FILE_END_TIMESTAMP - FILE_START_TIMESTAMP))
183
184 # 파일별 소요시간을 시:분:초 형식으로 변환
185 FILE_HOURS=$((FILE_DURATION / 3600))
186 FILE_MINUTES=$(((FILE_DURATION % 3600) / 60))
187 FILE_SECONDS=$((FILE_DURATION % 60))
188
189 # 1보다 작으면 0으로 표시
190 if [ $FILE_HOURS -lt 1 ]; then FILE_HOURS=0; fi
191 if [ $FILE_MINUTES -lt 1 ]; then FILE_MINUTES=0; fi
192
193 if [ $EXIT_CODE -eq 0 ]; then
194 logger "✅ [완료] $BASENAME 처리 완료: $FILE_END_TIME (소요: ${FILE_HOURS}시간 ${FILE_MINUTES}${FILE_SECONDS}초)"
195 else
196 logger "❌ [실패] $BASENAME 처리 실패: $FILE_END_TIME (소요: ${FILE_HOURS}시간 ${FILE_MINUTES}${FILE_SECONDS}초)"
197
198 # 오류 메시지만 추출하여 로그에 기록
199 ERROR_MSG=$(echo "$OUTPUT" | grep -E "(ERROR|FATAL|WARNING|오류|실패|실패했습니다)" || echo "$OUTPUT")
200 if [ -n "$ERROR_MSG" ]; then
201 logger "⚠️ 오류 내용: $ERROR_MSG"
202 echo "=== $BASENAME 처리 오류 상세 내용 ===" >> "$LOG_FILE"
203 echo "$OUTPUT" >> "$LOG_FILE"
204 echo "=====================================" >> "$LOG_FILE"
205 fi
206
207 logger "🔄 다음 파일 처리를 계속 진행합니다."
208 fi
209}
210
211# job control 함수
212function wait_for_jobs() {
213 while (( $(jobs -rp | wc -l) >= MAX_JOBS )); do
214 sleep 1
215 done
216}
217
218# 병렬 처리는 이미 위에서 완료되었습니다.
219logger "🔄 병렬 처리 완료"
220
221# 데이터 입력 완료 시간 기록
222DATA_END_TIME=$(date '+%Y-%m-%d %H:%M:%S')
223DATA_END_TIMESTAMP=$(date +%s)
224DATA_DURATION=$((DATA_END_TIMESTAMP - START_TIMESTAMP))
225
226# 데이터 입력 시간을 시:분:초 형식으로 변환
227DATA_HOURS=$((DATA_DURATION / 3600))
228DATA_MINUTES=$(((DATA_DURATION % 3600) / 60))
229DATA_SECONDS=$((DATA_DURATION % 60))
230
231# 1보다 작으면 0으로 표시
232if [ $DATA_HOURS -lt 1 ]; then DATA_HOURS=0; fi
233if [ $DATA_MINUTES -lt 1 ]; then DATA_MINUTES=0; fi
234
235# 3. (선택) 인덱스 재생성 (권장: 한 번에 생성)
236INDEX_START_TIME=$(date '+%Y-%m-%d %H:%M:%S')
237INDEX_START_TIMESTAMP=$(date +%s)
238
239logger "🔍 공간 인덱스 생성 시작: $INDEX_START_TIME"
240
241# 공간 인덱스 생성 (PostGIS 확장이 활성화되어 있어야 함)
242INDEX_OUTPUT=$(psql -U "$USER" -d "$DB" -c "CREATE INDEX IF NOT EXISTS ${TABLE_LOWER}_geom_idx ON $SCHEMA_LOWER.$TABLE_LOWER USING GIST (geom);" 2>&1)
243INDEX_EXIT_CODE=$?
244
245if [ $INDEX_EXIT_CODE -eq 0 ]; then
246 logger "✅ Spatial index created successfully"
247else
248 logger "❌ Failed to create spatial index"
249
250 # 오류 메시지만 추출하여 로그에 기록
251 INDEX_ERROR_MSG=$(echo "$INDEX_OUTPUT" | grep -E "(ERROR|FATAL|WARNING|오류|실패|실패했습니다)" || echo "$INDEX_OUTPUT")
252 if [ -n "$INDEX_ERROR_MSG" ]; then
253 logger "⚠️ 인덱스 생성 오류 내용: $INDEX_ERROR_MSG"
254 echo "=== 공간 인덱스 생성 오류 상세 내용 ===" >> "$LOG_FILE"
255 echo "$INDEX_OUTPUT" >> "$LOG_FILE"
256 echo "=====================================" >> "$LOG_FILE"
257 fi
258
259 logger "⚠️ PostGIS 확장이 활성화되어 있는지 확인하세요: CREATE EXTENSION IF NOT EXISTS postgis;"
260 logger "🔄 인덱스 생성에 실패했지만 스크립트는 계속 진행됩니다."
261fi
262
263# 인덱스 재생성 완료 시간 기록
264INDEX_END_TIME=$(date '+%Y-%m-%d %H:%M:%S')
265INDEX_END_TIMESTAMP=$(date +%s)
266INDEX_DURATION=$((INDEX_END_TIMESTAMP - INDEX_START_TIMESTAMP))
267
268# 인덱스 재생성 시간을 시:분:초 형식으로 변환
269INDEX_HOURS=$((INDEX_DURATION / 3600))
270INDEX_MINUTES=$(((INDEX_DURATION % 3600) / 60))
271INDEX_SECONDS=$((INDEX_DURATION % 60))
272
273# 1보다 작으면 0으로 표시
274if [ $INDEX_HOURS -lt 1 ]; then INDEX_HOURS=0; fi
275if [ $INDEX_MINUTES -lt 1 ]; then INDEX_MINUTES=0; fi
276
277logger "=================================="
278logger "✅ 작업 완료"
279logger "📋 대상테이블: $SCHEMA_LOWER.$TABLE_LOWER"
280if [ "$SRID_NEW" -ne 0 ]; then
281 logger "🗺️ 좌표계: $SRID_ORI$SRID_NEW (변환됨)"
282else
283 logger "🗺️ 좌표계: $SRID_ORI (원본)"
284fi
285logger "⏱️ 데이터 입력 소요시간: ${DATA_HOURS}시간 ${DATA_MINUTES}${DATA_SECONDS}"
286logger "⏱️ 공간 인덱스 소요시간: ${INDEX_HOURS}시간 ${INDEX_MINUTES}${INDEX_SECONDS}"
287logger "=================================="