전체 글
-
[AI 코딩테스트] 동원엔터프라이즈_AI직무 코딩테스트 후기투자/취준관련 2022. 5. 22. 16:30
서론 : 머기업들이 프로그래머스 플랫폼을 활용해서, AI직무를 위한 코딩테스트를 보는 것 같다. 일단 동원 AI에서는 "프로세스를 할 줄 아느냐? 하이퍼 파라미터 조정에 시간을 날리지 않았으면 좋겠다" 고 하였다. ================================================== 1. 이미지 데이터 비젼 Classify 태스크 포인트 : 1. 비전 테스크임에도 불구하고 cv2 사용이 불가능했다! 2. png파일들의 모음을 전부 import하는 것부터 시작해야했다. 즉, os.walk등 파일들 불러오는것부터 시작해서, PIL이나 cv2를 통해 image로 객체화까지 성공해야한다. 3. 전처리 -> 이미지에 대해 /255.0으로 전처리 함을 의미한다. 4. 데이터 스플릿 5. 모델 ..
-
[issue-sklearn] ValueError: Input contains NaN, infinity or a value too large for dtype('float32').CS/ML&DL 2022. 5. 22. 16:18
동원그룹 AI 시험을 보는데 데이터 쉐입 잘 맞춰서 랜덤포레스트 fit에 넣었더니 이런 에러가 뜨더라. 문제는 null값은 잘 처리했었는데 왜 이런 에러가 떴는지 알 길이 없던 것... numpy docs도 못봐서 결국 못풀고 제출했다... https://datascience.stackexchange.com/questions/11928/valueerror-input-contains-nan-infinity-or-a-value-too-large-for-dtypefloat32 ValueError: Input contains NaN, infinity or a value too large for dtype('float32') I got ValueError when predicting test data using ..
-
[Pandas] 판다스 메서드 정리 (1)CS/언어 2022. 5. 22. 04:59
내가 보기위한 정리 1. loc 과 iloc의 차이 1-1 . 짝수번째 칼럼만 출력 iloc[: , ::2] 2. select_dtypes(incldue or exclude = 'object') 3. quantile(0.75 or 0.25 etc...) 사분위값 구하기 4. reset_index(drop, level, inplace 등) 5. $160 -> str[1:] 으로 $ 표시 제거 가능 6. df['new_price] = 어쩌구 : 새 칼럼 생성 7. sort_values 말 그대로 정렬해주는 메서드 8. 컬럼 내 특정 단어가 있는지 여부 df.loc[df.item_name.str.contains('Chips')
-
[강의] 베이지안 관련 링크CS/ML&DL 2022. 5. 22. 04:13
https://for-my-wealthy-life.tistory.com/25?category=950144 베이지안 최적화(optimization) 개념 Auto Ml로 하이퍼파라미터 튜닝하기 모델 성능 향상을 위해서 필요한 하이퍼파라미터 튜닝, Auto ML로 Hyperparameter Optimization이 가능하다. Hyperparameter Optimization은 크게 그리드서치, 랜덤서치, 베이지안 옵티마이제이션 3가지가 있다... for-my-wealthy-life.tistory.com https://www.edwith.org/bayesiandeeplearning/joinLectures/14426 Bayesian Deep Learning 강좌소개 : edwith - 최성준 www.edwith..
-
[issue] predict_proba와 TypeError: list indices must be integers ... 이하 문제CS/ML&DL 2022. 5. 22. 04:06
predict_proba를 통해 확률값을 구하고 (predict_proba에 대한 친절한 설명 : https://www.inflearn.com/questions/199841) 확률값에 [: , 1] 로 슬라이싱을 해야하는데 슬라이싱에서 에러가 발생한다. TypeError: list indices must be integers or slices, not tuple proba의 return 값이 tuple로 생성되기 때문이란 것인데, 그럼 list로 변경하면 될 것이 아닌가? 싶기도 하지만, 해결이 쉽지 않았다. 정말 의외였던 것은, 다들 이 현상을 겪었으리라 싶어서 솔루션을 금방 찾을 줄 알았다. 그러나 동일 현상에 대한 자료를 찾기가 어려웠다. [같은 이슈가 없다 == 내가 어딘가 삽질했다] 라는 가능성..
-
[pandas] select_dtypes 에서의 objectCS/언어 2022. 5. 22. 01:26
발단 : 하단 그림에서 보면 select_dtypes 파라미터 옵션값에 따라서 수치형 / 범주형 변수를 구분하여 출력할 수 있음을 확인할 수 있다. 그런데 dtype에서 object형이 무엇인지를 설명하는 블로그가 많이 없었다. (docs도 마찬가지였는데, 아마 내 정보력이 부족한 탓이 아닐까 싶다) 우선 내가 object형이란 것에 대해 헷갈린 가장 큰 이유는 "파이썬은 모든 것이 object"이기 때문이다. https://ahracho.github.io/posts/python/2017-05-01-everything-in-python-is-object-integer/ [기초 파이썬] 파이썬의 모든 것은 Object이다 (정수편) C에서 변수가 저장되는 방식 : 변수 = 메모리 C에서 특정한 값이 변수에..