China
En respuesta a los problemas de insuficiente protección de la privacidad y rendimiento de los modelos tradicionales de análisis de datos de salud de atletas, este artículo exploró métodos de entrenamiento de modelos distribuidos basados en el marco del aprendizaje federado. En primer lugar, se segmentaron los datos de los atletas por tiempo, índice corporal, equipamiento deportivo y condiciones ambientales, y se utilizaron protocolos de seguridad de la capa de transporte y cifrado homomórfico para proteger el procesamiento de datos. Para el entrenamiento del modelo local, se seleccionó un árbol de decisión ligero; se empleó aprendizaje ponderado dinámico para la agregación del modelo; finalmente, se aplicó tecnología de privacidad diferencial para proteger la privacidad de los datos mediante la adición de ruido gaussiano, y se utilizaron métodos de optimización para mejorar el rendimiento del modelo. En el tercer experimento de rendimiento del modelo, la precisión alcanzó el 98,45%, lo que indica una precisión y fiabilidad extremadamente altas en tareas de clasificación y regresión. En el experimento de aceleración, con un intervalo de sincronización de 50 y 200 clientes, la aceleración del modelo fue de 4,01, lo que demuestra que el modelo mejora eficazmente la eficiencia del entrenamiento con la participación de múltiples clientes. En la prueba de riesgo de fuga de privacidad, la tasa de éxito del modelo presentado en este artículo fue la más baja bajo ataque, con un 1,5 %, un 2,3 % y un 1,4 %, respectivamente. Finalmente, en la prueba de pérdida del modelo, este experimentó el descenso más rápido en la etapa inicial, con un valor de convergencia final de 0,3, el menor entre los modelos probados. Los datos demostraron que el modelo estudiado en este artículo presentó un buen rendimiento y capacidad de protección de la privacidad.
In response to the problems of insufficient privacy protection and model performance in traditional athlete health data analysis models, this paper explored distributed model training methods based on the framework of federated learning. The paper first divided athlete data into time segmentation, body index segmentation, sports item segmentation, and environmental condition segmentation, and used transport layer security protocols and homomorphic encryption to protect data computation. When training the local model, a lightweight decision tree was selected for training; the dynamic weighted learning was used to aggregate the model; finally, differential privacy technology was applied to protect data privacy by adding Gaussian noise, and some optimization methods were used to improve model performance. In the third experiment of model performance, the precision of the model in this paper reached 98.45%. This indicated that the model had extremely high accuracy and reliability in classification and regression tasks. In the speedup ratio experiment, when the synchronization interval was 50 and the number of clients was 200, the speedupratio of the model in this paper was 4.01, reflecting that the model can effectively improve training efficiency with the participation of multiple clients. In the privacy leakage risk test, the success rate of the model in this paper was the lowest underattack, at 1.5%, 2.3%, and 1.4%, respectively. Finally, in the model loss test, the model in this paper experienced the fastest decline in the initial stage, with a final convergence value of 0.3, which was the smallest among the tested models. The data showed that the model studied in this paper had good performance and privacy protection ability.