Original research article

Korean Journal of Soil Science and Fertilizer. 31 August 2025. 324-334
https://doi.org/10.7745/KJSSF.2025.58.3.324

ABSTRACT


MAIN

  • Introduction

  • Materials and Methods

  •   CH4 배출량 예측모델 구축을 위한 환경요인 데이터 확보

  •   ML 알고리즘의 성능 평가를 위한 CH4 배출량 평가

  •    CH4 배출량 예측모델 개발 및 검증

  • Results and Discussions

  •   CH4 배출량과 환경요인 간의 상관관계

  •   CH4 배출량 예측모델의 성능 평가

  •   CH4 배출량 예측모델의 검증

  • Conclusion

Introduction

기후변화 (climate change)의 가속화로 인해 작물 생산성은 점차 감소함에 따라 식량안보 위기가 심화되고 있으며, 이를 해결하기 위한 온실가스 (greenhouse gas, GHG) 배출 완화는 대표적인 환경문제로 대두되었다 (Lee et al., 2024a; Shin et al., 2024; Huan and Liu, 2025). 다양한 GHG 배출원 중 벼 재배는 농업부문 전체 메탄 (methane, CH4) 배출량의 약 22.0%를 차지하며, 이는 주로 혐기적 환경에서 메탄생성균에 활동에 의해 배출되는 것으로 알려져 있다 (Kwon et al., 2022; Baek et al., 2025). 이러한 CH4 배출 저감을 위해 많은 현장 기반의 연구가 수행되었으며 (Lee et al., 2023; Kang et al., 2024; Kim et al., 2024), 최근에는 다양한 machine learning (ML) 알고리즘을 이용하여 CH4 배출량을 추정하고 있다 (Lee et al., 2024b; Huan and Liu, 2025). 이러한 ML 기반의 CH4 배출량 예측은 Intergovernmental Panel on Climate Change (IPCC)의 온실가스 배출량 산정 방식 중 tier 3에 해당하며, 이는 tier 1과 2보다 더 정확하고, 신뢰성 높은 배출량 산정 결과를 제시할 수 있습니다. 그 예로, Lee et al. (2024b)은 multiple linear regression 알고리즘을 이용하여 벼 품종 및 이앙시기에 따른 총 CH4 배출량을 추정하였으며, 약 80%의 추정 데이터가 실측 데이터와 유사한 CH4 배출량을 나타낸다고 보고하였다. 또한, Jahan et al. (2024)는 풍속을 기반으로 미국 캘리포니아주 500지점에서의 CH4 배출량을 예측하기 위해 convolutional neural network 알고리즘을 적용하였으며, 5% 미만의 오차율을 나타내었다고 보고하였다. 이러한 선행연구들은 공통적으로 ML 기반의 예측은 낮은 불확실성을 갖는 고도화된 CH4 측정 기술이며, 동일한 자원 투입으로 더 넓은 지역에 대해 신뢰도 높은 결과를 얻을 수 있음을 나타내었다. 이러한 ML 적용의 강점은 Kang et al. (2023a)의 연구에서도 보고된 바 있으며, ML 알고리즘을 활용한 CH4 배출량 추정은 현장 기반의 연구보다 낮은 노동력 및 비용이 소모되며, 높은 활용성 및 재현성을 갖는다. 하지만, ML 알고리즘 종류, 환경요인 유형, 표본 수 등의 다양한 변수가 CH4 배출량 추정에 미치는 영향을 종합적으로 평가한 연구는 거의 수행되지 않았으며, 이는 결과에 대한 불확실성 (uncertainty)을 감소시킬 수 있는 중요한 부분 중 하나이다 (Cui and Gong, 2018).

따라서, 본 연구에서는 비료시비 요인의 포함에 따라 ML 알고리즘의 CH4 배출량 예측 성능이 향상될 것이라고 가설을 설정하였으며, 이를 검증하기 위해 현장에서 측정한 데이터와 3종 (multiple linear regression, ridge regression, random-forest)의 ML 알고리즘을 이용하여 CH4 배출량 예측모델을 개발하였다. 최적의 ML 알고리즘은 성능 평가를 통해 선정하였으며, 이를 기반으로 비료 시비 요인의 포함 유무에 따른 예측 성능을 비교하였다. CH4 배출량 예측모델 구축에 사용된 환경요인은 기상요인, 시비방식, 그리고 토양 특성으로 구분되었으며, Pearson 상관관계 분석과 상대적 중요도 분석을 통해 예측모델 내에서의 영향력을 평가하였다.

Materials and Methods

CH4 배출량 예측모델 구축을 위한 환경요인 데이터 확보

CH4 배출량 ML 예측모델 학습을 위한 현장 데이터는 2024년 충남대학교 시험 논 포장에서 실시한 CH4 배출량 평가 결과와 기상청 자료를 취합하여 사용하였으며, 각 환경요인의 기술 통계량을 분석한 결과는 Table 1에 나타내었다. 기후 특성 중 일 평균 기온 (daily mean temperature, Air temp.)과 일 강수량 (daily precipitation, Prec.)은 시험포장에서 1.60 km 떨어진 대전광역시 기상청에서 제공하는 기상 자료를 활용하였으며, 일 평균 수온 (agricultural water mean temperature, Water temp.) 및 지온 (soil mean temperature, Soil temp.)은 시험포장에서 디지털 온도계를 이용하여 측정하였다 (Kang et al., 2023b; Lee et al., 2024b). 비료 처리량 (quantity of fertilization, Fert.)은 전체 N 비료 처리량 (90 kg N ha-1) 중 실제 투입한 N의 비율(%)로 나타내었으며, 깊이 거름주기 (fertilizer deep-placement, FDP)의 유무는 비료의 처리 깊이(cm)를 이용하여 표현하였다. 토양 특성 중 산화환원전위 (soil oxidation-reduction potential, Eh)는 현장에서 직접 측정하였으며, 토양 배수성 (soil drainage, Drain.)은 지표면에서부터 지하수위를 측정한 결과를 이용하였다.

Table 1

Descriptive statistics of soil samples used for estimating the statistical relationship between independent parameters and methane emissions (n = 325).

Parameters Air temp.1Soil temp.Water temp.Prec.Fert.FDPEhDrain.CH4
Mean (SE, SD) 26.62
(0.11, 1.91)
25.44
(0.09, 1.58)
27.67
(0.46, 8.31)
2.29
(0.37, 6.60)
93.33
(0.52, 9.44)
21.67
(0.66, 11.80)
-58.71
(2.29, 41.29)
47.50
(1.80, 32.55)
563.55
(25.02, 450.37)
Medium (Max., Min.) 26.35
(22.90, 30.30)
25.20
(22.70, 29.10)
29.90
(0.00, 36.40)
0.00
(0.00, 28.80)
100.00
(80.00, 100.00)
30.00
(5.00, 30.00)
-66.00
(-146.00, 39.00)
47.50
(15, 80)
473.20
(-5.72, 2,984.69)
Skewness 0.11 0.35 -2.65 3.61 -0.71 -0.71 -0.99 -0.00 1.34
Kurtosis -0.63 -0.68 6.34 11.76 -1.50 -1.50 0.22 -2.01 2.94
Variations 3.65 2.50 69.14 43.54 89.16 139.32 1,704.86 1,057.52 202,833.34

1temp., mean temperature; Prec., daily precipitation; Fert., quantity of fertilization; FDP, fertilizer deep-placement; Eh, oxidation-reduction potential; Drain., soil drainage; SE, standard error; SD, standard deviation; Max, maximum; Min., minimum.

CH4 배출량 평가를 실시한 토양의 기초 정보는 Table 2에 나타내었다.

Table 2

Soil texture and chemical properties of experimental site.

Soil texture pH
(1:5, H2O)
EC1
(dS m-1)
TC
(g kg-1)
OM
(g kg-1)
TN
(g kg-1)
Avail. P
(mg kg-1)
Exch. cations (cmolc kg-1)
K+ Ca2+ Mg2+
Sandy loam 6.05 ± 0.03 0.38 ± 0.01 15.23 ± 0.41 24.55 ± 0.12 0.98 ± 0.05 169.43 ± 0.75 0.30 ± 0.01 5.17 ± 0.25 0.63 ± 0.01

1EC, electrical conductivity; TC, total carbon; OM, organic matter; TN, total nitrogen; Avail. P, available phosphorus.

ML 알고리즘의 성능 평가를 위한 CH4 배출량 평가

예측 결과와 비교를 위한 실제 벼논에서 배출된 CH4는 Intergovernmental Panel on Climate Change (IPCC)에서 권고한 간이폐쇄정태 챔버법에 따라 평가하였으며, 투명한 아크릴 재질의 W 60 × D 60 × H 120 cm 규격으로 제작되었다 (Lee et al., 2023; Kim et al., 2024; Kim et al., 2025). 일일 CH4 가스 시료는 60 mL 주사기를 이용하여 매주 금요일 오전 10시부터 12시 사이에 30분간 발생한 양을 주 1회 채취하였으며, 현장에서 채취한 가스 시료는 gas chromatograph (GC, Agilent 6890N, Agilent Technologies Inc., California, USA) 및 불꽃 이온화 검출기 (flame ionization, detector, FID)를 이용하여 정량하였다. 벼 재배기간 중 배출된 일일 CH4 배출량은 아래 Eq. 1을 이용하여 계산하였다.

(Eq. 1)
DailyCH4flux=p×V/A×c/t×273/T

위 식에서 p는 CH4의 밀도 (mg L-1)를 나타내며, V는 챔버 내 부피 (L), A는 챔버 내 면적 (m2), Δc/Δt는 포집 시간 동안의 CH4 농도 변화 (ppmv), 그리고 T는 챔버 내 온도 (K)를 나타낸다 (Kim et al., 2024).

CH4 배출량 예측모델 개발 및 검증

본 연구에서는 파이썬 소프트웨어 (State of Delaware, USA)과 3종의 ML 알고리즘 (multiple linear regression, ridge regression, random-forest)을 이용하여 CH4 배출량 예측모델을 개발하였다. 사용한 알고리즘 중 multiple linear regression (MLR)은 다양한 환경요인과 관측된 CH4 배출량을 선형 방정식에 대입하여 결과를 예측하는 대표적인 선형 관계 알고리즘으로, 높은 적용성과 쉬운 사용성으로 인해 많은 연구에서 선호되는 알고리즘이다 (Kang et al., 2024; Lee et al., 2024a). MLR 알고리즘과 유사한 선형 관계 기반의 알고리즘 중 하나인 ridge regression (Ridge)은 다중공선성에 의한 예측 효율 감소를 방지한 기능을 포함한 알고리즘으로, 정규화 이론은 따라 비선형관계를 포함한 알고리즘보다 높은 회귀 성능을 나타낼 수 있다 (Hoerl and Kennard, 1970). 마지막으로, random-forest (RF) 알고리즘은 다양한 결정 트리의 조합을 이용하여 결과를 도출하는 앙상블 기법의 알고리즘으로, 높은 비선형 관계 해석능력을 보유하여 회귀분석과 분류에 모두 사용할 수 있다 (Kang et al., 2024).

ML 예측모델 도출 전, Pearson 상관계수 분석을 통해 논 토양 배수성에 따라 구분한 환경요인과 CH4 배출량 간의 상관관계를 조사하였으며, 변수의 상대적 중요도 (importance)를 분석하였다. 이후, 전체 데이터는 시기에 따라 나열한 후 무작위로 섞은 후, 예측모델 구축과 검증을 위해 8:2의 비율로 구분되었다. 각 데이터 셋은 결정계수 (coefficient of determination, R2)와 조정된 결정계수 (adjusted coefficient of determination, adj. R2)를 이용하여 알고리즘 별 설명력을 평가하였다 (Sonn et al., 2022; Kang et al., 2024). 알고리즘 별 R2 값 비교를 통해 가장 높은 R2를 나타내는 알고리즘은 K-Fold cross-validation을 10회 반복 수행하여 교차 검증을 수행하였으며, 최종 도출한 예측모델은 quantile-quantile (Q-Q) plot과 Shapiro 검정, 그리고 5종의 통계지표를 이용하여 정규성과 예측모델 내 오류를 검증하였다 (Table 3).

Table 3

Brief summary of the statistical error metrics for residual analysis and model validation.

Abbreviation Full name Formula
R2 Coefficient of determination 1-i=1nyi-y'i2i=1nyi-y''i2
ME Mean error 1ni=1nyi-y'i
MSE Mean squared error 1ni=1nyi-y'i2
RMSE Root mean squared error 1ni=1nyi-y'i2
MAE Mean absolute error 1ni=1nyi-y'i
MAPE Mean absolute percentage error 100ni=1nyi-y'iyi

Sourced from Kang et al. (2024).

Results and Discussions

CH4 배출량과 환경요인 간의 상관관계

본 연구에서 CH4 배출량 예측모델 개발에 사용된 변수들 사이의 상관관계는 Pearson 상관계수 (Pearson’s r)와 중요도 (importance)의 형태로 제시하였으며, 그 결과는 Fig. 1에 나타낸 바와 같다. 온도 지표는 CH4 배출량과 가장 강한 양 (+)의 상관관계를 나타내었으며, 기온 (Air temp.)과 지온 (Soil temp.)의 Pearson 상관계수 (r)가 각각 +0.46과 +0.43이었다 (Fig. 1A). N 시비 방식을 나타내는 깊이 거름주기 (FDP, Pearson’s r = +0.28)도 온도 지표와 유사한 반면, N 비료 처리량 (Fert.)과 토양 배수성 (Drain.)은 각각 -0.28과 -0.18로 CH4 배출량과 음 (-)의 상관관계를 나타내었다. 본 연구에서 수온 (Water temp.), 강수량 (Prec.), 그리고 토양 Eh의 Pearson 상관계수는 각각 -0.06, -0.00, 그리고 +0.01로 분석되었으며, 이는 3종의 환경요인과 CH4 배출량 간의 상관관계가 상대적으로 매우 낮은 수준임을 나타낸다.

이러한 결과는 변수의 중요도에서도 유사하게 분석되었으며, 기온의 상대적 중요도가 0.490으로 가장 높게 분석되었다 (Fig. 1B). 본 연구에서 지온, N 시비량, 깊이 거름주기, 그리고 토양 배수성의 상대적 중요도는 각각 0.273, 0.190, 0.170, 그리고 0.168이었다.

다양한 재배요인에 따른 CH4 배출량 변화를 보고한 Lee 등 (2024b)는 기온과 수온의 변화가 CH4 배출량에 미치는 영향은 서로 상이하여 기온은 CH4 배출량과 양 (+)의 상관관계를 보이는 반면, 수온의 증가는 CH4 배출량을 감소시킨다고 보고하였다. 본 연구에서도 CH4 배출량에 대한 Air temp.Water temp.의 Pearson 상관계수는 각각 +0.46과 -0.06으로, 선행연구와 유사한 경향을 나타내었다. 그러나, 선행연구와 달리, 본 연구에서는 물과 관련된 변수인 Water temp., Prec., 그리고 Eh는 CH4 배출량과 상대적으로 낮은 연관성을 나타내었으며, 이러한 결과는 CH4 배출 특성에 기인하는 것으로 판단된다 (Fig. 1). 일반적으로, CH4은 환원조건 (soil Eh, -100 mV ~ -300 mV)의 토양에서 메탄생성균에 의해 생성되어 벼 통기조직을 통해 주로 배출된다고 알려져 있으며, 이로 인해 CH4 배출량 평가가 주로 담수상태에서 수행된다 (Lee et al., 2023; Kim et al., 2024; Baek et al., 2025; Kim et al., 2025). 본 연구에서는 담수기간 중 조사한 수온, 강수량, 그리고 토양 Eh 변화와 일일 CH4 배출량 간의 상관관계를 분석함에 따라 환경요인의 변화 폭이 작아 낮은 상관관계를 보이는 것으로 판단된다. 이러한 결과는 수위 변동에 따른 CH4 배출량을 보고한 선행연구의 결과와 일치하며, 이는 토양이 호기조건에서 혐기조건으로 전환됨에 따라 CH4 배출량은 차이를 보이나, 수위 변화에 따른 차이는 보이지 않았다고 보고하였다 (Su et al., 2024).

https://cdn.apub.kr/journalsite/sites/ksssf/2025-058-03/N0230580305/images/ksssf_2025_583_324_F1.jpg
Fig. 1

Statistical relationship between methane (CH4) emissions and environmental covariates (n = 325). (A) Heatmap representing the Pearson correlation between CH4 emissions and environmental factors and (B) Relative importance of each parameter used for forecasting the CH4 emissions. Temp. represented the temperature, while Prec., Eh, Fert., FDP, and Drain. denoted the precipitation, oxidation-reduction potential, quantity of nitrogen fertilization, fertilizer deep-placement, and soil drainage, respectively.

CH4 배출량 예측모델의 성능 평가

3종의 ML 알고리즘을 기반으로 환경요인 변화에 따른 CH4 배출량을 예측한 결과는 Table 4에 나타내었다. 선형 (linear) 관계를 가정하는 MLR과 Ridge 알고리즘을 사용한 예측모델 훈련 세트의 R2 값은 0.360으로, 비선형 (non-linear) 관계를 포함하는 RF 알고리즘 (R2 = 0.861)보다 2.39배 낮은 수준이었으며, 모델의 신뢰도 보정을 실시한 Adj. R2 값도 이와 유사한 경향을 나타내었다. 예측모델 검증 세트에서의 신뢰성 (R2, Adj. R2) 지표는 모두 감소하는 경향을 나타내었으나, RF 알고리즘을 사용한 예측모델에서 각각 0.795와 0.761로 가장 높게 조사되었다. 5종의 통계지표 분석 결과는 R2 및 Adj. R2와 상반된 경향을 나타내어 RF 알고리즘에서 가장 낮았으며, 훈련 세트보다 검증 세트에서 더 높게 조사되었다. 특히, RF 알고리즘을 이용한 훈련 세트의 RMSE, MAE, 그리고 MAPE 값은 각각 2.210 g ha-1, 1.048 g ha-1, 그리고 0.686%이었다. 최종 도출한 RF 기반의 예측 모델과 실측 CH4 배출량을 비교한 결과는 Fig. 2에 나타내었다.

Table 4

Performance of the predictive model for daily CH4 fluxes using three machine learning algorithms.

Algorithms Training dataset Validation dataset
R2 1 Adj. R2 ME MSE RMSE
(g ha-1)
MAE
(g ha-1)
MAPE
(%)
R2 Adj. R2 ME MSE RMSE
(g ha-1)
MAE
(g ha-1)
MAPE
(%)
MLR 0.360 0.347 0.000 1.310 3.624 2.452 6.738 0.351 0.307 2.471 9.314 4.470 3.347 7.216
Ridge 0.360 0.347 0.000 1.315 3.624 2.423 6.861 0.351 0.307 2.465 9.279 4.462 3.333 7.359
RF 0.861 0.856 0.000 0.490 2.210 1.048 0.686 0.795 0.761 1.368 2.976 2.356 1.192 1.628

1MLR, multiple linear regression; Ridge, ridge regression; RF, random-forest; R2, coefficient of determination; Adj. R2, adjusted coefficient of determination; ME, mean error; MSE, mean squared error; RMSE, root mean squared error; MAE, mean absolute error; MAPE, mean absolute percentage error.

https://cdn.apub.kr/journalsite/sites/ksssf/2025-058-03/N0230580305/images/ksssf_2025_583_324_F2.jpg
Fig. 2

Summary of substituting the RF-based predictive model for predicting the daily CH4 emissions and the measured data. Error bars of the measured and predicted values denoted the standard deviation (n = 3) and standard error, respectively.

본 연구에서 사용된 MLR 및 Ridge 알고리즘은 선형 관계를 기반으로 한다는 점에서 서로 유사한 특징을 가지나, MLR 알고리즘과 달리 Ridge 알고리즘은 모델 내에 과적합 (over-fitting) 방지를 위한 제약이 추가된다 (Lee et al., 2024b). 반면, RF 알고리즘의 경우, 여러 개의 의사결정 트리를 이용하여 비선형 관계를 설명할 수 있는 앙상블 학습 알고리즘으로 알려져 있다 (Kang et al., 2024). 본 연구에서는 알고리즘 내 비선형 관계의 설명능력이 추가됨에 따라 설명력을 나타내는 지표인 R2 값이 0.360에서 0.861로 증가하였으며, 이는 다양한 환경요인과 CH4 배출량은 주로 비선형 관계로 해석됨을 의미한다. 또한, 이는 실측 데이터와 예측된 결과의 차이를 나타내는 5종 (ME, MSE, RMSE, MAE, MAPE)의 오류 지표를 분석한 결과와 유사한 경향을 나타내며, 일반적으로 낮은 오류 지표를 갖는 예측모델은 우수한 설명력을 보유한다고 판단한다 (Botchkarev, 2019; Jang and Kim, 2022; Park and Choi, 2022; Joshi et al., 2023; Kang et al., 2024).

CH4 배출량 예측모델의 검증

본 연구는 각 알고리즘 별 Adj. R2 결과 비교를 통해 RF 알고리즘을 최종 선발하였으며, RF 알고리즘 기반의 CH4 배출량 예측모델을 검증하기 위해 K-Fold cross-validation을 실시한 결과는 Table 5에 나타내었다. RF 기반의 CH4 배출량 예측모델의 평균 설명력 (R2)은 약 83% 수준이었으며, 최소 R2 값과 최대 R2 값은 각각 0.68과 0.95이었다. 그러나, skewness 및 kurtosis를 확인하였을 때, 10회 반복 수행한 결과의 상대적인 분포 (skewness < 0; kurtosis > 0)가 주로 평균치 초과에 주로 분포하고 있어 실제 모델의 설명력은 평균보다 높을 것으로 판단된다(Kang et al., 2024). 또한, 예측모델의 정규성 (normality) 검정을 위해 Q-Q plot과 Shapiro-Wilk 검정을 이용하였을 때, 실측 데이터가 light tailed의 형태 (y = 418.20 x + 43.84, R2 = 0.99)로 분포하고 있어 정규성을 만족한다고 판단하였으며, Shapiro-Wilk 검정의 p-value는 0.05 이상으로 분석되어 정규성을 만족함을 확인하였다 (Fig. 3).

많은 선행연구에서 다양한 기상요인에 의해 CH4 배출량이 제어됨에 따라 예측모델 내에서도 이는 중요하게 작용한다고 보고된 반면, 예측모델 내에서 N 시비방식 및 토양 배수성 관련 요인에 따른 변화는 거의 보고된 바 없다 (Lee et al., 2024b).

Table 5

Brief summary of K-Fold cross-validation for assessing the reliability of the predictive model for daily CH4 fluxes (n = 10).

Parameters Mean (SE, SD)1 Medium (Min. - Max.) Skewness Kurtosis Variations
Value 0.83 (0.03, 0.08) 0.83 (0.68 - 0.95) -0.41 0.05 0.00

1SD, standard error; SD, standard deviation; Min., minimum value; Max., maximum value.

https://cdn.apub.kr/journalsite/sites/ksssf/2025-058-03/N0230580305/images/ksssf_2025_583_324_F3.jpg
Fig. 3

Quantile-quantile (Q-Q) plot representing the normality of the predictive model for CH4 emissions.

이에 따라, 본 연구에서는 예측모델 내 N 시비방식 및 토양 배수성과 관련된 3종의 독립변수 포함 여부에 따른 R2 값을 비교하여 예측모델 내 변수 3종의 영향력을 평가하였다 (Fig. 4). 3종의 변수 (Fert., FDP, Drain.)가 모두 빠진 예측모델은 0.672로 가장 낮은 R2 값을 나타내었으며, 이는 본 연구에서 도출한 예측모델보다 설명력이 약 16% 낮은 수준이었다. 예측모델 내에서 각각의 변수가 제외됨에 따라 예측모델의 설명력은 6% (Fert.), 7% (FDP), 그리고 5% (Drain.) 감소하였다.

https://cdn.apub.kr/journalsite/sites/ksssf/2025-058-03/N0230580305/images/ksssf_2025_583_324_F4.jpg
Fig. 4

Comparison of explanatory capacity (R2) of each predictive model based on differences in parameter combinations. The R2 parameter represented the coefficient of determination, while Drain., FDP, and Fert. denoted the soil drainage, fertilizer deep-placement, and quantity of nitrogen fertilization, respectively.

본 연구에서 도출한 CH4 배출량 예측모델의 평균 설명력 (mean R2 value = 0.83)은 다른 선행연구에서 보고한 선형 방식의 예측모델 (37% - 82%)보다는 높았으나 (Busman et al., 2023; Nikolaisen et al., 2023; Wang et al., 2023; Lee et al., 2024b), 비선형관계를 포함한 알고리즘 (예, random-forest, robust, artificial neural network 등)을 사용한 모델보다는 소폭 낮은 수준이었다 (Pence et al., 2024). 이러한 결과는 본 연구에서 사용된 변수가 대부분 단편적인 시계열 데이터를 사용함에 따른 것으로 판단되며, 예측모델의 설명력은 지속적인 DB 구축함에 따라 점차 증가할 것으로 판단된다.

Conclusion

본 연구에서는 2024년 벼 재배 중 조사한 환경요인과 3종 (multiple linear regression, ridge regression, random- forest)의 machine learning (ML) 알고리즘을 이용하여 CH4 배출량 예측모델을 구축하였으며, 알고리즘 별 설명력 비교를 통해 최적의 알고리즘을 선정하였다. 환경요인과 CH4 배출량 간의 상관관계 분석 시, CH4 배출량은 기온 (Pearson’s r = +0.46), 지온 (Pearson’s r = +0.43), 그리고 깊이 거름주기 (Pearson’s r = +0.28)와 유의한 양의 상관관계를 나타내었다. 이와 반대로, 질소 (nitrogen, N) 비료 시용량과 토양 배수성의 상관계수는 각각 -0.28과 -0.18로, 음의 상관관계를 나타내었다. 각 ML 알고리즘 별 설명력 (R2)을 비교하였을 때, 비선형 관계를 포함하는 random- forest 알고리즘에서 0.861로 multiple linear regression (R2 = 0.360)과 ridge regression (R2 = 0.360)보다 2.39배 높았으며, 10회 반복수행한 평균 설명력은 약 83% 수준이었다. 또한, 변수 조합에 따른 R2 비교 시, 비료 사용 및 토양 배수성과 관련된 변수가 추가됨에 따라 예측모델의 설명력이 16% 증가하였으며, 각 변수가 제외됨에 따라 예측모델의 설명력은 평균적으로 약 6% 감소하였다. 따라서, 벼논에서의 CH4 배출량 예측을 위해서는 N 시비방식 및 토양 특성이 반영된 다양한 환경요인과 random-forest 알고리즘을 조합하였을 때, 일일 CH4 배출량을 약 96% 신뢰도로 예측할 수 있을 것으로 생각된다. 하지만, 본 연구에서 구축한 예측모델은 국내 충청 지역에 국한된 결과를 활용하여 고도화된 국가단위 혹은 대륙단위의 CH4 배출량 예측을 위해서는 다양한 지역 및 국가에서 구축된 데이터베이스가 필요할 것으로 판단된다.

Funding

This research study was conducted with support from a research grant awarded by the Cooperative Research Program for Agriculture Science & Technology Development of Rural Development Administration, Republic of Korea (Project No. RS-2024-00400491).

Conflict of Interest

The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.

Author Contribution

Kang YG: Conceptualization, Formal analysis, Data curation, Writing-original draft, Lee JY: Conceptualization, Formal analysis, Data curation, Visualization, Kim JH: Formal analysis, Data curation, Choi J: Formal analysis, Data curation, Kim JH: Formal analysis, Data curation, Chun JH: Formal analysis, Data curation, Oh TK: Conceptualization, Writing-review & editing, Funding acquisition, Project administration.

Data Availability

All data will be provided on reasonable request.

References

1

Baek N, Lee SI, Pia HI, Park SW, Shin ES, Lee J, Kim HY, Choi WJ. 2025. Biochar effects on methane emission from rice paddy differ with nitrogen fertilization, organic inputs, and water management. Korean J. Soil Sci. Fert. 58:133-143. https://doi.org/10.7745/KJSSF.2025.58.1.133

10.7745/KJSSF.2025.58.1.133
2

Botchkarev A. 2019. A new typology design of performance metrics to measure errors in machine learning regression algorithms. Interdiscip. J. Inf. Knowl. Manag. 14:45-79. https://doi.org/10.28945/4184

10.28945/4184
3

Busman NA, Melling L, Goh KJ, Imran Y, Sangok FE, Watanabe A. 2023. Soil CO2 and CH4 fluxes from different forest types in tropical peat swamp forest. Sci. Total Environ. 858:159973. https://doi.org/10.1016/j.scitotenv.2022.159973

10.1016/j.scitotenv.2022.159973
4

Cui Z, Gong G. 2018. The effect of machine learning regression algorithms and sample size on individualized behavioral prediction with functional connectivity features. NeuroImage 178:622-637. https://doi.org/10.1016/j.neuroimage.2018.06.001

10.1016/j.neuroimage.2018.06.001
5

Hoerl E, Kennard RW, 1970. Ridge Regression: Biased Estimation for Nonorthogonal Problems. Technometrics 12, 55-67. https://doi.org/10.1080/00401706.1970.10488634

10.1080/00401706.1970.10488634
6

Huan S, Liu X. 2025. Machine learning-driven analysis of greenhouse gas emissions from rice production in major Chinese provinces: Identifying key factors and developing reduction strategies. Eur. J. Agron. 164:127536. https://doi.org/10.1016/j.eja.2025.127536

10.1016/j.eja.2025.127536
7

Jahan I, Mehana M, Matheou G, Viswanathan H. 2024. Deep Learning-Based quantification of methane emissions with field applications. Int. J. Appl. Earth Obs. Geoinf. 132:104018. https://doi.org/10.1016/j.jag.2024.104018

10.1016/j.jag.2024.104018
8

Jang H, Kim S. 2022. Income prediction of apple and pear farmers in Chungnam area by automatic machine learning with H2O.Al. Korean J. Agric. Sci. 49:619-627. [in Korean] https://doi.org/10.7744/kjoas.20220056

10.7744/kjoas.20220056
9

Joshi R, Kholiya S, Pandey H, Joshi R, Emmanuel O, Tewari A, Kim T, Cho BK. 2023. A comparison of ATR-FTIR and Raman spectroscopy for the non-destructive examination of terpenoids in medicinal plants essential oils. Korean J. Agric. Sci. 50:675-69. https://doi.org/10.7744/kjoas.500408

10.7744/kjoas.500408
10

Kang YG, Lee JH, Lee JY, Oh TK. 2023a. Statistical estimation of soil carbon stocks in Chungcheong province through digital soil mapping and multiple linear regression. Korean J. Soil Sci. Fert. 56:209-216. [in Korean] https://doi.org/10.7745/KJSSF.2023.56.3.209

10.7745/KJSSF.2023.56.3.209
11

Kang YG, Lee JH, Lee JY, Oh TK. 2023b. The effects of different management strategies on growth and quality of rice (Oryza sativa L.). Korean J. Agric. Sci. 50:75-86. [in Korean] https://doi.org/10.7744/kjoas.20230004

10.7744/kjoas.20230004
12

Kang YG, Lee JY, Kim JH, Oh TK. 2024. Quantifying soil organic matter for sustainable agricultural land management with soil color and machine learning technique. Agron. J. 116:982-989.

10.1002/agj2.21525
13

Kim JH, Kang YG, Lee JY, Kim JH, Choi JW, Oh TK. 2024. Influences of silicate fertilizers containing different rates of iron slag on CH4 emission and rice (Oryza sativa L.) growth. Korean J. Agric. Sci. 51:227-238. [in Korean] https://doi.org/10.7744/kjoas.510213

10.7744/kjoas.510213
14

Kim SU, Lee HH, Kim DH, Lee GH, Hong CO. 2025. Methane emission from paddy soil with different transplanting time of rice (Oryza sativa L.) in Gyeongsang region. Korean J. Soil Sci. Fert. 58:71-80. [in Korean] https://doi.org/10.7745/KJSSF.2025.58.1.071

10.7745/KJSSF.2025.58.1.071
15

Kwon HS, Choi EJ, Lee SI, Lee HS, Lee JM, Kang SS. 2022. Research review of methane emissions from Korean rice paddies. J. Clim. Chang. Res. 13:117-134. [in Korean] https://doi.org/10.15531/KSCCR.2022.13.1.117

10.15531/KSCCR.2022.13.1.117
16

Lee J, Yu M, Oketch EO, Nawarthne SR, Kim YB, Chathuranga NC, Maniraguha V, Cruz BGS, Seo E, Park H, Choi H, Yu DJ, Kim JK, Heo JM. 2024a. Effect of dietary protein levels and age on growth performance, total excreta and nitrogen balance of laying hens during the growing phase. Korean J. Agric. Sci. 51:193-203. [in Korean] https://doi.org/10.7744/kjoas.510210

10.7744/kjoas.510210
17

Lee JH, Lee JY, Kang YG, Kim JH, Oh TK. 2023. Evaluating methane emissions from rice paddies: A study on the cultivar and transplanting date. Sci. Total Environ. 902:166174. https://doi.org/10.1016/j.scitotenv.2023.166174

10.1016/j.scitotenv.2023.166174
18

Lee JY, Kang YG, Kim JH, Kim JH, Choi J, Oh TK. 2024b. Quantification of methane emissions in rice paddies: A machine learning approach with rice cultivar and transplanting date. Korean J. Soil Sci. Fert. 57:331-343. [in Korean] https://doi.org/10.7745/KJSSF.2024.57.4.331

10.7745/KJSSF.2024.57.4.331
19

Nikolaisen M, Hillier J, Smith P, Nayak D. 2023. Modelling CH4 emission from rice ecosystem: A comparison between existing empirical models. Front. Agron. 4:1058649. https://doi.org/10.3389/fagro.2022.1058649

10.3389/fagro.2022.1058649
20

Park HJ, Choi WJ. 2022. Prediction of soil organic carbon contents of rice paddies in South-Western Coastal Area of Korea using random forest models. Korean J. Soil Sci. Fert. 55:58-70. [in Korean] https://doi.org/10.7745/KJSSF.2022.55.1.058

10.7745/KJSSF.2022.55.1.058
21

Pence I, Kumas K, Cesmeli MS, Akyuz A. 2024. Future prediction of biogas potential and CH4 emission with boosting algorithms: the case of cattle, small ruminant, and poultry manure form Turkey. Environ. Sci. Pollut. Res. 31:24461-24479. https://doi.org/10.1007/s11356-024-32666-7

10.1007/s11356-024-32666-738441735PMC10998781
22

Shin JH, Kang YG, Lee JY, Kim JH, Oh TK. 2024. Effect of poultry manure biochar on soil nutrition and carbon improvement in Saemangeum reclaimed soils. Korean J. Agric. Sci. 51:643-654. [in Korean] https://doi.org/10.7744/kjoas.510418

10.7744/kjoas.510418
23

Sonn YK, Yoo JH, Luyima D, Lee JY, Chun JH, Kang YG, Oh TK, Cho J. 2022. Development of models to estimate total soil carbon across different croplands at a regional scale using RGB photography. Int. J. Environ. Res. Public Health 19:9344. https://doi.org/10.3390/ijerph19159344

10.3390/ijerph1915934435954699PMC9368161
24

Su Y, Liu W, Rahaman MH, Chen Z, Zhai J. 2024. Methane emission from water level fluctuation zone of the Three Gorges Reservoir: Seasonal variation and microbial mechanism. Sci. Total Environ. 912:168935. https://doi.org/10.1016/j.scitotenv.2023.168935

10.1016/j.scitotenv.2023.168935
25

Wang Y, Hu Z, He S, Jing Q, Shen L, Wu Z, Huang W, Lu G, Cao R, Zheng K, Dong N, Jiang L, Ye J, Rong A, Xia X, Sun Y. 2023. Linear relationship between CH4 fluxes and atmospheric CO2 concentration levels controlled by rice biomass and soil methanogenic communities. Nutr. Cycl. Agroecosyst. 127:247-263. https://doi.org/10.1007/s10705-023-10299-5

10.1007/s10705-023-10299-5
페이지 상단으로 이동하기